Las apps que son tus ojos gracias a la IA

César Rodríguez Pérez
C. Rodríguez REDACCIÓN

RED

Jenna Day (Unsplash)

Dos aplicaciones de Microsoft (Seeing AI) y Google (Lookout) permiten a gente con problemas de visión leer textos, precios en supermercados y detectar lo que pasa a su alrededor

16 dic 2023 . Actualizado a las 10:38 h.

Para el gran público, la inteligencia artificial parecía material de novelas o películas de ciencia ficción hasta el verano del 2022, cuando eclosionaron las primeras aplicaciones populares de OpenAI y descubrimos a Chat GPT. Apenas un año después, Microsoft y Google libran una gran batalla por liderar esta tecnología. Y el mundo se desayuna cada día con un torrente de noticias sobre los posibles usos futuros y las consecuencias para la humanidad. 

El debate sobre la amnistía para los independentistas palidece alrededor del que planea sobre la IA. Por un lado, están los boomers, que creen en las bondades infinitas de esta tecnología y creen que hay que eliminar cualquier límite a su desarrollo. Y también prevén que generará un enorme esplendor económico. Por el otro, los doomers, que recelan de que la inteligencia artificial libre de restricciones pueda acabar con la humanidad.

En el contexto de este debate no resuelto, que fue el marco de la defenestración y el rescate de Sam Altman como primer ejecutivo de OpenAI, viejos proyectos de IA emergen para hacer la vida más fácil a muchos ciudadanos. Recientemente, Microsoft ha puesto a disposición de los usuarios de móviles Android (suponen el 80 % del mercado español, según StatCounter) una aplicación que lleva unos cuantos años, desde el año 2017, ayudando a las personas con problemas de visión que tenían un iPhone. La app se llama Seeing AI. Y sus creadores la definen como una «cámara parlante para ciegos» que «narra el mundo a tu alrededor». 

Facetas de la app Seeing AI, de Microsoft
Facetas de la app Seeing AI, de Microsoft

¿Cómo funciona Seeing AI? Utiliza la cámara del móvil e inteligencia artificial para contarle con audio al propietario del móvil lo que podría estar viendo si su capacidad no estuviera limitada. La app es multitarea y tiene capacidad de narrar en varios idiomas: castellano, italiano, turco, holandés, alemán, francés y japonés, además del omnipresente inglés.¿Qué funciones ofrece?

Para empezar, lee textos cortos manuscritos, incluso los escritos con letras difíciles. Por supuesto, también puede con mecanografiados como etiquetas, sobres, folletos publicitarios o cualquier mensaje, aunque no se lleva bien con las maquetaciones artísticas. Las IA son gente de orden: les gusta la escritura sencilla de sujeto, verbo y predicado y las esctructuras bien jerarquizadas.

También identifica los billetes (pero no monedas) y los productos de los códigos de barras, lo que es muy útil para hacer la compra o llevar en casa un inventario de existencias en la nevera o en la despensa.

Y captura documentos. Guía a los usuarios para escanearlos con la cámara del móvil, los transforma en texto corrido y luego los lee y los comparte (en formato texto o imagen) si así se desea. 

Otra función destacada es la que permite identificar a la gente que hay alrededor, estimar su edad y rasgos básicos y valorar si su expresión es «feliz, neutra o enfadada». Llega con hacer una foto y escuchar la descripción. La misma tecnología -el «learning machine»- sirve para conseguir descripciones de  escenas como «una mujer sentada en un sofá» o «un pasillo largo con una puerta al fondo».

Funciones de la app Lookout, de Google
Funciones de la app Lookout, de Google

Seeing AI es una herramienta muy completa que funciona mejor en exterior si se complementa con unos buenos auriculares. Compite con otra aplicación similar de Google. Se llama Lookout, acumula medio millón de descargas en la tienda oficial de apps de Android y fue actualizada por última vez en noviembre. Puede accederse a ella a través del asistente de Google y pretende usar «la visión artificial para ayudar a personas invidentes o con baja visión a realizar tareas de una forma más rápida y sencilla». La cámara del móvil es la lente mágica que lee textos, encuentra objetos o descubre el entorno.

Lookout tiene seis modos. El primero es «Texto». Lee en voz alta cualquier conjunto de letras que detecte la cámara (si detecta que hay poca luz, enciende automáticamente la linterna del móvil). El segundo es «Documentos» y permite hacer una función parecida a la de Seeing AI: escanear una carta, un contrato, una propuesta de negocios... Y convertirlo en un texto corrido digital que poder escuchar y compartir. 

El tercer modo es «Explorar» y está en fase de pruebas (Beta). Describe los objetos y elementos que ve la cámara. El cuarto, «Moneda», identifica tipos de billetes y cantidades. El quinto, «Etiquetas alimentarias», sirve para leer códigos de barras. Para poder funcionar correctamente y detectar productos sin conexión, hay que hacer una descarga inicial de datos. El sexto, «Imágenes», también está disponible en pruebas. ¿Cómo funciona? Subes una imagen que haya en el terminal -que por ejemplo te hayan mandado por WhatsApp- y te la describe.