El ingeniero que hace que los coches autónomos vean y pone los ojos a los robots cirujanos

Jon Garay MADRID / COLPISA

SOCIEDAD

FUNDACIÓN BBVA | EUROPAPRESS

El profesor japonés Takeo Kanade ha ganado el premio Fronteras del Conocimiento por crear «los algoritmos fundacionales» que han impulsado los robots cirujanos, el reconocimiento facial del teléfono móvil y las repeticiones en 360 grados de las mejores jugadas de un partido de fútbol o el ojo del halcón en el tenis

07 feb 2024 . Actualizado a las 17:27 h.

Para que los coches autónomos puedan circular por las carreteras con seguridad, para que los robots cirujanos nos puedan operar, para que el teléfono móvil reconozca nuestro rostro o para que las retransmisiones deportivas sean tan espectaculares como son en la actualidad, es necesario que todas esas máquinas puedan ver. El premio Fronteras del Conocimiento en la Categoría de Tecnologías de la Información y el Conocimiento ha reconocido este año al profesor japonés Takeo Kanade (Tamba, 1945), el creador de los algoritmos que permiten «comprender e interpretar imágenes y escenas visuales» a los ordenadores y robots.

«Sin percepción, un robot no puede actuar en un entorno imprevisto y no estructurado. Por ejemplo, no podríamos construir ningún vehículo autónomo sin visión para que sea capaz de evitar colisiones. El profesor Kanade desplazó las fronteras del conocimiento en este campo de una manera que nadie había logrado anteriormente, y la escuela de pensamiento que fundó ha sido muy importante para el desarrollo de la visión artificial y sus aplicaciones en la percepción robótica», ha señalado el profesor Oussama Khatib, catedrático de Ciencias de la Computación y director del Laboratorio de Robótica en la Universidad de Stanford y miembro del jurado.

De la misma forma que los seres humanos y los animales necesitamos dos ojos para tener información de profundidad, la visión artificial en tres dimensiones solo es posible si se integran las imágenes procedentes de al menos dos cámaras. Sin embargo, los primeros algoritmos —un algoritmo es una secuencia de órdenes que en número de pasos ofrece un resultado. Algunos ejemplos son la receta de cualquier plato o las instrucciones para cambiar la rueda del coche— de visión artificial estaban pensados para procesar una sola imagen, y aplicarlos para integrar varias imágenes era un proceso demasiado lento como para utilizarse en la práctica. La solución a este problema llegó en 1981, cuando Kanade y su estudiante de doctorado Bruce Lucas idearon un método para agilizar el proceso.

Los «fotógrafos» del attosegundo, Premio Fronteras del Conocimiento

josé a. gonzález

En lugar de coger uno a uno cada fotograma y reconstruir después tanto los objetos que contiene como su movimiento, se dieron cuenta de que sería mucho más rápido aprovechar la información del movimiento de los objetos que graba cada cámara para comprender cómo se mueve la imagen incluso antes de realizar la integración entre los vídeos de todas las cámaras. En otras palabras, su 'algoritmo de flujo óptico' capta también las formas de los objetos y permite deducir la velocidad y dirección de su movimiento. «Esta es la base de la codificación de vídeo y se usa para prácticamente cualquier técnica de compresión de datos de imágenes en movimiento», explica el experto nipón.

Este procedimiento tenía un problema: requiere de una capacidad de computación muy superior. También esto lo pudo solucionar Kanade al desarrollar una técnica de simplificar drásticamente los cálculos que debe realizar el ordenador para procesar las imágenes en tres dimensiones. Corría el año 1992. Solo tres después, en 1995, dos investigadores de la Universidad de Carnegie Mellon recorrieron Estados Unidos de costa a costa por autopista en uno de los primeros vehículos autónomos jamás construidos. Solo manejaban el acelerador y el freno; el resto lo hacía aquella furgoneta pionera con sus cámaras. Y las cámaras veían gracias al algoritmo de Kanade, lo mismo que los robots que se pueden encontrar ya en algunos restaurantes y museos, los drones y hasta un helicóptero autónomo en el que ha trabajado el galardonado.

Coches autónomos y Superbowl

Si los coches autónomos necesitan ver con precisión, más todavía es necesario para los robots quirúrgicos. «Cualquier operación que se realiza hoy con ayuda de robots en gran parte está basada en sus contribuciones», explica el jurado del premio. Junto a su equipo desarrolló el primer sistema robotizado para la cirugía de prótesis de cadera, que consiguió una precisión mucho mayor en la colocación de la prótesis, disminuyendo así el riesgo de efectos secundarios.

Los aficionados al deporte también tienen una deuda con el experto japonés. Allá por el 2001 se utilizó por primera vez en la retransmisión de la Superbowl la repeticiones en 360 grados de las mejores jugadas. Es la misma tecnología que está detrás del 'ojo de halcón' en el tenis o de la posibilidad de ver un partido de fútbol desde el punto de vista del balón.

El avance de la tecnología en este campo ha llevado también a la creación de vídeos falsos. «Odio ver cómo se está aplicando la inteligencia artificial y la visión artificial a fenómenos como los vídeos falsos. Debería ser fácil poder certificar si una imagen es auténtica o falsa, y colocar una marca de agua para identificar los fraudes. En cualquier caso, me entristece que esta tecnología pueda tener un potencial para hacer daño, debido al mal uso que algunos quieran hacer de ella», asegura.

Kanade sucede al profesor Alberto Sangiovanni Vincentelli, que fue reconocido en esta misma categoría en la edición del año pasado por «transformar radicalmente» el diseño de los chips en los que se basa el funcionamiento de todos los dispositivos electrónicos actuales.

Nacido en la ciudad japonesa de Tamba en 1945, Takeo Kanade se doctoró en Ingeniería Eléctrica en la Universidad de Kyoto en 1974, donde ejerció la docencia durante los años siguientes para, en 1980, incorporarse a la Universidad Carnegie Mellon (Estados Unidos). Allí ha permanecido el resto de su carrera y hoy es titular de la cátedra U. A. y Helen Whitaker de Informática y Robótica. En Carnegie Mellon ha sido director del Instituto de Robótica (1992-2001) y creador del Centro de Tecnología para la Calidad de Vida, que dirigió entre 2006 y 2012. También ha sido director-fundador del Digital Human Research Center, en Tokyo, una iniciativa del Instituto Nacional de Ciencia y Tecnología Industrial de Japón. Titular de más de 20 patentes, ha sido asesor de la NASA o el Instituto Canadiense de Investigación Avanzada. Fue editor jefe fundador del 'International Journal of Computer Vision'; y forma o ha formado parte de los consejos de publicaciones como 'Medical Image Analysis', 'International Journal of Robotics Research' y 'Robotics and Autonomous Systems'.