Día de emociones fuertes para todos los que seguimos la andadura de Google en general y de Android en particular, el Google I/O pone patas arriba nuestra actualidad. Y la IA es el plato fuerte de la conferencia de desarrolladores: Sundar Pichai y los suyos anunciaron el modelo Gemini 1.5 Flash centrado en subir la velocidad de las respuestas. Además, otras versiones de Gemini reciben optimizaciones.
Google se encuentra actualmente en una encrucijada curiosa, no en vano es una compañía especializada en Inteligencia Artificial, creadora de las herramientas con las que se entrenan las IAs y que, sin embargo, perdió el podio en lo que a modelos de lenguaje e inteligencia generativa se refiere. Open AI supo robarle el testigo y se mantiene en lo alto de la innovación, el más reciente GPT-4o es la prueba. Google debía reaccionar.
Gemini 1.5 Flash, un modelo recortado que apunta a la velocidad
Tras varios meses comparando lo mejor de Open AI y lo mejor de Google, siempre constaté que el segundo era mucho más rápido. Con la escritura palabra por palabra, y la latencia en la valoración de la orden, no se puede decir que ChatGPT fuera precisamente Speedy Gonzales. Hasta que Open AI liberó el modelo GPT-4o.
A sabiendas de que la IA no es precisamente rápida, lo que dificulta su naturalidad, en Google han acelerado el modelo principal para recortarlo sin aligerar su comportamiento multimodal. De ahí nace Gemini 1.5 Flash, el último producto de la empresa y que se suma a los tres ya en marcha: Gemini Nani, Gemini 1.5 Pro y Gemini 1.5 Ultra.
Gemini 1.5 Flash está pensado para reducir la barrera de la latencia en las conversaciones sin que el modelo pierda las capacidades de entendimiento, análisis de contexto, de imagen y vídeo. 1.5 Flash ha sido entrenado a partir de su hermano 1.5 Pro «destilando» los procesos en pos de optimizar al máximo la ejecución. Por lo visto durante el Google I/O, los resultados suponen un notable avance en velocidad: puede extraer datos de documentos, resumir emails, interpretar tablas y mucho más.
Aparte del nuevo modelo, Google ha optimizado Gemini 1.5 Pro, el modelo que actualmente mueve el chatbot gratuito de Google. Este chatbot ahora puede entender de manera mucho más amplia las instrucciones, en distintos formatos y también estilos; con un comportamiento que Google asegura ser más humano.
Por último, Gemini Nano, la IA generativa a nivel de dispositivo, ahora también es multimodal: aparte del texto, el modelo ahora puede analizar imágenes. Está disponible en los Google Pixel 8 y se mantiene en la versión 1.0 (no como la 1.5 de sus hermanos, los que se ejecutan en la nube de Google). También llegará a más Google Pixel.
Gemini 1.5 Flash estará disponible a partir de hoy en la API de Google para desarrolladores y también en el chatbot de la empresa para todos los usuarios. Las mejoras de Gemini Nano se irán desplegando progresivamente a los Google Pixel.
Imagen de portada | Iván Linares
En Xataka Android | He probado la mejor IA de Google en el Samsung Galaxy S24 y se parece mucho a la que llevo usando en Android desde hace seis años