Google lanza Gemini, un chatbot y asistente de voz impulsado por IA

Primero fueron los asistentes digitales parlantes como Siri, Alexa y Google Assistant. Luego estaban los chatbots en línea como ChatGPT y Google Bard. Ahora los dos se están fusionando.

Google presentó el jueves Gemini, una aplicación para teléfonos inteligentes que actúa como asistente digital parlante y como chatbot conversacional. Al responder a solicitudes de voz y texto, puede responder preguntas, escribir poemas, generar imágenes, escribir correos electrónicos, analizar fotografías personales y realizar otras acciones, como configurar un cronómetro o realizar una llamada telefónica.

Disponible de inmediato para angloparlantes en más de 150 países y territorios, incluido Estados Unidos, Gemini reemplaza a Bard y Google Assistant. Está respaldado por tecnología de inteligencia artificial que la empresa ha estado desarrollando desde principios del año pasado.

La nueva aplicación está diseñada para realizar una variedad de tareas, incluyendo actuar como tutor personal, ayudar a los programadores de computadoras con tareas de codificación e incluso preparar a quienes buscan empleo para entrevistas, dijo Google.

«Puede ayudarte a interpretar roles en una variedad de escenarios», dijo Sissie Hsiao. Un vicepresidente de Google a cargo de la unidad Asistente de Google de la compañía, durante una sesión informativa con periodistas.

Cuando ChatGPT llegó de OpenAI a finales de 2022, sorprendiendo al público con la forma en que respondía preguntas, redactaba trabajos finales y generaba código informático, Google se encontró poniéndose al día. Al igual que otros gigantes tecnológicos, la empresa había pasado años desarrollando tecnología similar pero no había lanzado un producto tan avanzado como ChatGPT.

(El New York Times demandó a OpenAI y su socio, Microsoft, en diciembre, alegando infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial).

Google lanzó su propio chatbot, Bard, en marzo con críticas mediocres. En las semanas siguientes, la empresa fusionó sus dos principales laboratorios de IA (Google Brain y DeepMind) y anunció que el laboratorio combinado estaba desarrollando una nueva tecnología de IA llamada Gemini.

Gemini es lo que los investigadores llaman un modelo de lenguaje grande, o LLM, un sistema matemático que puede aprender habilidades analizando grandes cantidades de datos, incluidos libros, programas de computadora y chats en línea. Al identificar patrones en todo ese texto, un LLM puede aprender a generar texto por sí solo. Esto significa que puede escribir poesía, generar código informático e incluso mantener una conversación.

También es propenso a errores. Puede que se equivoque en los hechos o que tenga “alucinaciones”: inventar cosas.

Gemini es un sistema «multimodal», lo que significa que puede responder tanto a imágenes como a sonidos. Después de analizar un problema de matemáticas que incluía gráficos, formas y otras imágenes, pudo responder la pregunta de manera muy similar a como lo haría un estudiante de secundaria.

En diciembre, Google utilizó una versión limitada de esta tecnología para actualizar Bard. Ahora, la compañía ha retirado el nombre Bard y está lanzando una versión más poderosa de la tecnología a través de la aplicación Gemini, disponible en teléfonos Android y en la web. Una versión para iPhone llegará «en las próximas semanas», dijo Google.

Google ha creado una versión gratuita pero limitada de la aplicación Gemini. Una versión más potente, llamada Gemini Advanced y respaldada por una versión del modelo de lenguaje Ultra de Google, está disponible por una suscripción mensual de 19,99 dólares. Google ofrece una prueba gratuita de dos meses.

Google publicó resultados de pruebas comparativas que afirmaban que Ultra superó a la última tecnología de OpenAI, GPT-4, en varias áreas clave, incluida la generación de códigos informáticos y el resumen de artículos de noticias.

La aplicación Gemini también puede generar, analizar y responder a imágenes. Los usuarios pueden subir una foto de su fiesta del Super Bowl, por ejemplo, y pedirle a la aplicación que genere un título.

Google también dijo que ofrecerá tecnología similar a través de sus servicios empresariales Google Workspace y Google Cloud. Esto permitirá a los clientes utilizar la tecnología junto con aplicaciones como Gmail y Google Docs.

En los teléfonos Android, la nueva aplicación reemplazará al Asistente de Google si los usuarios descargan Gemini. Al igual que Google Assistant, puede responder a comandos de voz, aunque también responde a comandos de texto.

Google dijo que continuará ofreciendo y mejorando el Asistente de Google.

El año pasado, OpenAI lanzó una versión similar de su chatbot ChatGPT que puede responder a comandos de voz. La mayoría de los expertos de la industria creen que la tecnología de inteligencia artificial que impulsa los chatbots como ChatGPT se fusionará y reemplazará a asistentes digitales como Siri de Apple y Alexa de Amazon.

Más información