En un movimiento estratégico para contrarrestar a OpenAI y su reciente lanzamiento de ChatGPT-4o, Google ha presentado su última innovación en inteligencia artificial, denominada Gemini. Esta actualización promete revolucionar el buscador de Google, proporcionando una interacción más humana y natural con capacidades avanzadas de diálogo y visión.
Un Nuevo Paradigma en la Búsqueda
Gemini, el nuevo motor de búsqueda de Google, ha sido diseñado para emular una interacción con una persona real. Esta plataforma permite al usuario interrumpir y reorientar la conversación y utiliza la cámara del móvil como sus ojos para describir y resolver problemas visuales. La tecnología se está implementando inicialmente en Estados Unidos, con planes de expansión global.
Capacidades Avanzadas y Humanización de la Interacción
El CEO de Google, Sundar Pichai, destacó durante la conferencia anual Google I/O en Mountain View, California, que Gemini representa una transformación radical en el funcionamiento del buscador de Google. La plataforma no solo proporciona respuestas a consultas sucesivas, sino que también mantiene conversaciones personalizadas e interactivas, mezclando y combinando entradas y salidas.
“Gemini puede mantener una conversación personalizada e interactiva, mezclando y combinando entradas y salidas”, explicó Pichai.
Esta humanización del buscador fue inicialmente presentada en abril en el evento Google Next en Las Vegas, donde se mostraron robots que planifican y ejecutan acciones en nombre del usuario.
Habilidades Multimodales: Más que una Conversación
Demis Hassabis, director de DeepMind, explicó que Gemini ha sido diseñado como un agente multimodal, capaz de procesar información sensorial diversa. Esta capacidad permite que Gemini vea y escuche mejor, entienda el contexto y responda rápidamente, haciendo la interacción más natural.
Aplicaciones Prácticas de Gemini
Liz Reid, directora de Google Search, demostró cómo Gemini mejora la experiencia de búsqueda. En lugar de simplemente buscar restaurantes, los usuarios pueden pedir “un lugar para celebrar un aniversario”, y Gemini ofrecerá planes detallados, precios y localizaciones.
Asistente Personal y Contextual
Gemini va más allá de ser un simple robot de chat. Según Sissie Hsiao, vicepresidenta de Google y directora general de Gemini, la plataforma está diseñada para ser un asistente personal que proporciona respuestas personalizadas y mantiene conversaciones reales de ida y vuelta.
“Gemini es mucho más que un robot de chat. Está diseñado para ser su asistente personal”, afirmó Hsiao.
Avances Tecnológicos y Capacidad de Carga
Para gestionar la inmensa cantidad de datos, Google ha desarrollado nuevos dispositivos como los procesadores Axion y la TPU Trillium. Además, los suscriptores de Gemini 1.5 Pro pueden gestionar hasta un millón de tokens, lo que permite cargar y analizar grandes volúmenes de datos como PDFs extensos o líneas de código.
Innovaciones en Fotografía, Vídeo y Música
Aunque la principal novedad de Google I/O fue Gemini, también se presentaron mejoras en inteligencia artificial para fotografía, vídeo y música. La versión 3 de Imagen, la creación de vídeos con Veo, y la música con Lyria y Synth ID muestran el compromiso de Google con la innovación continua.