Andrew Ng, uno de los investigadores más conocidos en el campo de la Inteligencia Artificial (IA), fundador del proyecto Google Brain, cofundador de la plataforma de aprendizaje online Coursera y profesor de la Universidad de Stanford (EE.UU.) usa la metáfora de que la Inteligencia Artificial es la nueva electricidad. La IA también está transformando el mundo en la actualidad, y según todo indica, lo seguirá haciendo durante los próximos años.
Los inicios de la IA se fechan a mediados del siglo pasado, pero ha saltado a la primera línea de la tecnología por la confluencia de varios factores, uno de los cuales es la enorme disponibilidad de datos en nuestro mundo cada vez más digitalizado. El uso de estos datos, en las más diversas áreas, desde la industria hasta la educación, el medio ambiente o la salud, nos permite derivar patrones, información útil y conocimiento.
Los datos, como mi compañera de grupo de investigación Bertha Guijarro y yo escribimos en febrero del 2019 en un artículo del suplemento Mercados de La Voz de Galicia, son la materia prima de la nueva era de la información. Y como todas las materias primas, no solo importa disponer de ellas, sino que es importante cómo se tienen, y para qué se van a utilizar.
Hemos asistido a muchas discusiones por el uso indebido y/o no autorizado de datos, lo que ha despertado en la opinión pública la conciencia de propiedad, protección y privacidad.
En la UE esta situación se ha recogido en la orientación ética, robusta, confiable y explicable que la IA tiene en nuestro Viejo Continente. En EE.UU., quizás, la situación es algo más relajada, por el inmenso poder que tienen sus empresas, pero estas en los últimos años también se han decantado por la elaboración de códigos éticos, y el rediseño de algunas de sus políticas. El mundo occidental miraba preocupado y cauteloso hacia el uso de los datos carente de toda privacidad, y no solo de forma estética, que gobiernos como el de China, el otro gran gigante en la IA, hacía en su país.
Después de ejemplos de sesgo en técnicas de reconocimiento facial o algoritmos de contratación se puede decir que los algoritmos en sí no están sesgados, y que los sesgos en los datos se pueden corregir, indudablemente, de forma mucho más rápida de lo que pueden corregirse en las personas.
Y en medio de todo este debate ético llega la crisis sanitaria y económica ocasionada por el covid-19. Un virus, por cierto, cuya potencial peligrosidad ya había sido advertida por la empresa canadiense Bluedot, días antes de que la Organización Mundial de la Salud (OMS) lo comunicase de forma oficial. Esta misma empresa, cuyo trabajo consiste en monitorizar la propagación de enfermedades infecciosas, ya había anticipado anteriormente la dispersión del virus zika en el 2015. La empresa maneja de forma habitual el esquema de trabajo que se prevé crecerá en el futuro, un escenario en el que las personas compartirán trabajo con las máquinas, dejando a las máquinas la parte más tediosa de análisis de datos.
El sistema usa técnicas de procesado de lenguaje natural y modelos de aprendizaje automático para examinar información de distintos medios en más de sesenta idiomas, informes sanitarios de brotes de enfermedades, también en animales, datos de líneas y pasajeros de compañías aéreas para predecir la dispersión de los posibles brotes... y todo eso es verificado posteriormente por un equipo de médicos y epidemiólogos. Luego, la compañía emite su informe a sus clientes, entre otros, agencias de salud gubernamentales.
Sin embargo, y a pesar de que hemos hecho dioses de algoritmos que usan datos, atribuyéndoles a veces capacidades casi de adivinación, nadie pudo predecir la magnitud de la epidemia, y lo que es peor, nadie tomó ni siquiera medidas mínimas para que la epidemia no se transformase en pandemia, aunque ya muchos habían alertado, como Bill Gates en el 2015 en una conferencia en Canadá.
Anticiparnos
La lección aquí es que, aunque los sistemas inteligentes tienen fallos, la tecnología y el aprendizaje mediante el procesamiento masivo de datos pueden permitirnos anticiparnos a epidemias globales como la actual, para intentar paliar o anular sus efectos a tiempo. Gates apuntó a errores que cometemos con la recogida de datos e informes, en formatos no digitales, con datos incompletos que contribuyen a la inexactitud de la información. Pero también apuntó a lo que llama «fallo global»: la falta de equipos médicos preparados y la falta de preparación de la población. Nos falta esfuerzo en sanidad, educación e investigación, los tres pilares que deben soportar cualquier sociedad de bienestar.
Ya dentro del escenario actual, las autoridades nos han informado de las últimas cifras de infectados detectados, fallecidos y recuperados. También hemos visto predicciones de la evolución y sobre las necesidades de recursos hospitalarios. Pero esas cifras, siendo útiles, no son exactas, no estamos midiendo igual en las diferentes zonas. Las propias características del proceso, como son su crecimiento exponencial o las diferencias individuales generan mucho ruido en los datos, lo que hace difícil su análisis y añade imprecisión a los resultados. Es urgente no solo tener buenos y homogéneos modelos de medida, muchos datos y que estos estén abiertos a la comunidad científica, sino que, muy especialmente, es importante tener datos con calidad.
Ya se debate si en nuestros países admitiremos un control sobre las personas tan exhaustivo como el que se llevó a cabo, por ejemplo, en China, cuya población ya empieza a ver la luz. Las aplicaciones que anuncia nuestro Gobierno no son invasivas, y en principio se basarán en datos anonimizados para poder derivar nuestros patrones de movimiento y trazar nuestros encuentros con otras personas, en el caso de que se produzcan contagios. La vuelta a la normalidad también va a requerir datos de calidad y el uso de herramientas de Inteligencia Artificial puede ayudarnos en la tarea. Estamos aún a tiempo de prepararlas.
Reflexionemos sobre la calidad de los datos recogidos, con incidencia directa sobre su utilidad.
Amparo Alonso Betanzos es catedrática de Computación e Inteligencia Artificial de la UDC y presidenta de Asociación Española de Inteligencia Artificial