La IA de Google recorta terreno con ChatGPT: Gemini Pro 1.5 sube de nivel

Google no puede detenerse en su camino a recuperar el trono de la Inteligencia Artificial, el prestigio le viene en ello. Y a falta de conocer la ingente cantidad de sorpresas relacionadas que nos esperan en el próximo Google I/O, la empresa acaba de evolucionar gran parte de sus modelos actuales. Incluso planea revolucionar Gmail incluyendo Gemini.

Paso a paso, y novedad tras novedad, Google va mejorando su Inteligencia Artificial generativa en un intento de recuperar el terreno ante el tremendo acelerón que pegó su principal contrincante, Open AI. Y Gemini tiene vital importancia en la estrategia de Google, ya que la empresa puso todo el empeño en trazar una estrategia multimodal para enfrentarse con las mejores armas a todo lo que está implicando ChatGPT. El duelo de chatbots está siendo una batalla casi a muerte.

Google especializa su IA generativa en imagen y audio

Con un evento reciente centrado en la nube y en las capacidades de la IA, Google dio a conocer todas las novedades que se dirigen a sus clientes, especialmente a los de empresa. Porque Workspace atrajo gran parte de la atención, aunque no todo es IA profesional, que los usuarios de Android también vamos a beneficiarnos del salto cualitativo y funcional de Gemini.

En Xataka Android

Las mejores apps con IA para tu Android: desde ChatGPT a LuzIA

Google sigue mejorando sus motores de IA generativa principales, ahí se encuentran Imagen2, para la creación de contenido gráfico, y Gemini Pro 1.5, el modelo de lenguaje intermedio (de los tres que tiene Gemini). Según la empresa, aumentan las capacidades de generación y de interpretación; aparte de que se introducen novedades para lograr que el contenido apto para los chatbots tenga mayor amplitud.

Entre las novedades de la IA de Google se encuentran:

Imagen2 gana la capacidad de crear Gifs. Si ya obtenía muy buenos resultados creando imágenes dentro de herramientas como el propio Gemini (sólo en Estados Unidos), Google introduce ahora la posibilidad de que Imagen2 haga Gifs de hasta cuatro segundos con sólo pedírselo. Además, Google incluirá una marca de agua invisible para identificar el contenido creado como hecho desde una IA.
Gemini Pro 1.5 ahora analiza contenido en audio. Aparte de texto y de imágenes, el chatbot puede identificar cualquier porción de sonido sin necesidad de transcribirlo a texto. Esto hace posible el resumen de una llamada, por ejemplo. O de una entrevista.
La IA de Google ahora crea vídeos: nace Google Vids. Esta herramienta, de momento exclusiva de los usuarios profesionales de Workspace, permitirá la creación de vídeos a partir de una orden. En principio el contenido será apto para presentaciones y similares.
Gemini llega a Gmail. El salto que Google lleva preparando pronto estará aquí: los modelos de Gemini aterrizarán en el cliente de correo para que crear nuevos mails sea cuestión de pedirlo. Además, Gmail incorporará órdenes por voz.

Como es habitual, todas estas novedades relacionadas con la Inteligencia Artificial irán llegando progresivamente a los usuarios. Primero serán los suscriptores de Google Workspaces quienes las aprovecharán, después irán aterrizando en los servicios para particulares. Gemini llegará a Gmail sólo para los suscriptores de Google One, también en la app móvil.

Imagen de portada | Iván Linares

Más información | Google

En Xataka Android | He probado la mejor IA de Google en el Samsung Galaxy S24 y se parece mucho a la que llevo usando en Android desde hace seis años