Veo, Imagen 3 y Lyria. Así son los modelos de IA generativa de Google para vídeo, imágenes y música

Google demuestra su interés por el potencial de la inteligencia artificial generativa en su evento de hoy

Imagen de un elefante de amigurumi creado con la nueva IA de Google
Sin comentarios Facebook Twitter Flipboard E-mail

Después de muchos meses de espera, el conocido como Google I/O (la conferencia anual para desarrolladores de Google) ha dado comienzo hoy mismo con un evento en el que la inteligencia artificial ha sido protagonista indiscutible.

Entre otras muchas novedades, Google nos ha sorprendido con el lanzamiento de nuevos modelos de IA generativa para vídeo e imágenes que tienen por objetivo mejorar el proceso creativo de sus usuarios. ¿En qué consisten exactamente Veo, Imagen 3 y Lyria? Te contamos todos los detalles a continuación.

Crear vídeos a partir de prompts de texto es posible con Veo

Captura de pantalla mostrando el fragmento de un vídeo generado por Veo Veo es capaz de generar vídeos en HD a partir de prompts de texto

Hace unos meses hablábamos acerca de Sora, la espectacular herramienta de OpenAI capaz de crear todo tipo de vídeos a partir de texto (aunque por ahora no está disponible públicamente). En el evento de hoy, Google ha presentado Veo, un modelo capaz de generar vídeo a partir de prompts en texto con el que la compañía pretende competir con OpenAI.

Tal y como afirman desde Google, Veo es capaz de generar vídeos en resolución 1080p de más de un minuto de duración en un amplio número de estilos visuales distintos. Tal y como adelantábamos, la herramienta funciona a partir de las instrucciones en texto del usuario y se encarga de generar un vídeo que se asemeje lo máximo posible a nuestra idea original.

Una de las preocupaciones más habituales al hablar de vídeos generados por IA es la dificultad de distinguirlos de vídeos reales. En relación a este punto, Google ha confirmado que los vídeos que creemos con Veo tendrán una marca de agua imperceptible al ojo humano que  en caso de necesidad permitirá identificar que un vídeo ha sido generado con IA.

Este modelo está disponible desde hoy mismo para un grupo limitado de usuarios de VideoFX. En el futuro, la compañía pretende ofrecer las posibilidades de Veo en YouTube Shorts y otros productos similares.

Imagen 3 nos permite crear imágenes mediante IA a partir de texto

Dejando a un lado la generación de vídeo mediante IA, Imagen 3 es el nuevo modelo de generación de imágenes a partir de prompts de texto desarrollado por la compañía. Durante la presentación, Google ha mostrado varias imágenes generadas con Imagen 3 en las que podemos apreciar el nivel de detalle conseguido.

Sin duda, uno de los puntos que nos ha llamado la atención acerca de este modelo es lo bien que se lleva con el texto: al contrario que otras herramientas similares, Imagen 3 parece obtener muy buenos resultados cuando queremos incluir fragmentos de texto o palabras sueltas en las imágenes que generamos.

Plumas de colores formando la palabra Light Imagen 3 es capaz de formar palabras de la forma en la que indiquemos en el prompt. En este caso, se ha formado la palabra Light mediante plumas de colores

Si has usado otras herramientas de este estilo habrás podido comprobar que es habitual que la IA se salte letras o incluso palabras completas cuando le pedimos que incluya un fragmento de texto en una imagen.

Al parecer, uno de los puntos fuertes de Imagen 3 es el renderizado de texto. Tal y como puedes ver en la imagen superior, la IA de Google es capaz de formar palabras mediante los elementos que indiquemos en el prompt sin ningún tipo de error.

Al igual que en el caso de los vídeos creados con Veo, Imagen 3 también añade una marca de agua invisible a nuestras imágenes para evitar un uso negativo de las mismas.

Lyria pretende revolucionar la creación musical gracias al apoyo de la IA

A finales del año pasado escuchamos hablar por primera vez acerca de Lyria, el plan de Google para revolucionar la forma de crear música mediante inteligencia artificial. Para lograrlo, la compañía ha llegado a acuerdos con diferentes músicos, compositores y productores musicales, lo que les permite diferenciarse de herramientas similares que han ido surgiendo a lo largo de los últimos meses.

Como parte del trabajo de la compañía en este sector, Google cuenta con Music AI Sandbox, una suite de herramientas musicales mediante IA que permite crear música usando diferentes instrumentos desde cero.

Ejemplo de interfaz de las herramientas musicales de IA de Google Imagen | Google

Además, la compañía ha aprovechado para anunciar nuevas colaboraciones con Wyclef Jean, Marc Rebillet y Justin Tranter, que han explicado como usan los modelos de inteligencia artificial de Google para crear canciones y cuentan con ejemplos reales y en sus canales de YouTube. Al igual que con el contenido en vídeo, las canciones creadas con Lyria tendrán una marca de agua invisible gracias a SynthID, la tecnología usada por la compañía.

Imágenes | Google

En Xataka Android | La app de Gemini para Android ya está aquí. Así puedes probar la IA más avanzada de Google en tu móvil

Inicio