Google lanza Gemini, un modelo de inteligencia artificial que compite con el ser humano

l. M. REDACCIÓN / LA VOZ

SOCIEDAD

La compañía presenta tres versiones de su herramienta «más avanzada y capaz» para operar tanto en los grandes centros de datos como en los teléfonos móviles

06 dic 2023 . Actualizado a las 20:10 h.

La tecnológica OpenAI golpeó primero en la carrera de la inteligencia artificial (IA) con el lanzamiento de ChatGPT, pero ahora tendrá que vérselas con un nuevo rival en este sector en expansión. Google presentó ayer Gemini, su modelo de IA «más avanzado y capaz» desarrollado en colaboración por los equipos de Google, DeepMind y Google Research. En su carta de presentación, la tecnológica subraya que se trata de un modelo «multimodal» que «puede generalizar y comprender, operar y combinar a la perfección distintos tipos de información, como texto, imágenes, audio, vídeo y lenguajes de código». En resumen, puede realizar un razonamiento más sofisticado y elaborado para llegar al objetivo último de estos sistemas se proponen: parecerse, y superar, a la mente humana.

Google destaca de esta herramienta su flexibilidad, que le permite ejecutarse de forma eficiente tanto en dispositivos móviles como en grandes centros de datos. Para adaptarse a los diferentes requerimientos, la primera versión Gemini 1.0 llega en tres tamaños diferentes: Ultra, «más potente y de mayor tamaño, para tareas de gran complejidad»; Pro, el «mejor modelo para escalar en una amplia gama de tareas», y Nano, el «más eficiente para ejecutar tareas directamente en un dispositivo».

 

Según señalan, Gemini se distingue de los modelos conocidos hasta ahora porque está «construido sobre capacidades de próxima generación». Esto quiere decir que los modelos multimodales actuales suelen entrenar sus componentes por separado para diferentes modalidades y luego los unen para imitar parte de dichas funcionalidades, lo que los hace buenos para realizar tareas, como describir imágenes, pero se enfrenta a dificultades a la hora de ejecutar un razonamiento más conceptual y complejo. El avance que Gemini quiere aportar se basa en su condición «nativa», es decir, que ha sido «entrenado desde el principio en diferentes modalidades» y perfeccionado a continuación. «Esto ayuda a Gemini a comprender y razonar perfectamente sobre todo tipo de entradas desde cero, mucho mejor que los modelos multimodales existentes, y sus capacidades son de última generación en casi todos los dominios», subraya la compañía.

En lo que afectará a los usuarios, Bard (el chatbot creado por Google para competir con ChatGPT) cuenta desde ayer con una versión afinada de Gemini Pro disponible en inglés en más de 170 países y territorios, lo que supone la mayor mejora de su herramienta de lenguaje generativo desde su lanzamiento el pasado mes de mayo. Ahora incluye «mejoras en el resumen, tormenta de ideas, escritura y planificación».

Gemini también se está incorporando al nuevo teléfono móvil Pixel 8 Pro, impulsando nuevas funciones, y en próximos meses llegará a servicios como Search, Ads, Chrome y Duet AI.

Para los desarrolladores y empresas, a partir del día 13 de diciembre estará disponible Gemini Pro a través de Google AI Studio y Vertex AI.

Sundar Pichai, CEO de Google y Alphabet, aseguró que los avances en materia de inteligencia artificial apenas están acariciando la superficie. «Hoy hemos dado el paso siguiente en este viaje con Gemini, el modelo más avanzado y capaz que hemos creado hasta la fecha, que ha obtenido resultados excelentes en muchas de las cotas de referencia más utilizadas», afirmó. La empresa subraya que con una puntuación del 90,0 %, Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea, que utiliza una combinación de 57 materias y pone a prueba tanto el conocimiento del mundo como la capacidad para resolver problemas.