He puesto a Veo 3.1 y Sora 2 frente a frente creando vídeos. La frontera con la realidad es cada vez más difusa

Parecía que la frontera del vídeo iba a tardar en cruzarse y ya la hemos superado con creces: podemos crear grabaciones que casi no se distinguen de la realidad. Sora fue el gran salto adelante de la generación, Google sacó después Veo 3 y le pasó por encima a OpenAI. Tras esto, Sora 2 se tomó la merecida revancha: sus vídeos han inundado Internet. Ahora, Google se equipara con el nuevo Veo 3.1.

Qué cambia. El 3.1 de la versión ya deja entrever que no supone un cambio drástico en el modelo. Aun así, las mejoras introducidas son importantes, tanto en la generación como en los resultados. Me han gustado mucho las primeras pruebas que hice en la app de Gemini.

Según Google, Veo 3.1 incrementa el realismo de las generaciones, mejora la interacción con el audio generado, permite crear conversaciones mucho más naturales, los resultados son más fieles a las órdenes y, algo importante, Google ha implementado una mayor adaptación a las imágenes que adjunta el usuario. Crear vídeos a partir de una foto sube de nivel.

Aviso de disponibilidad de Veo 3.1 en la app de Gemini

Duelo de titanes. He estado probando varias órdenes y diría que, como media, me gustan más los resultados de Sora 2: OpenAI suele conseguir algo bueno a la primera. A menudo pasándose de listo, ya que se inventa muchos diálogos. Suele clavarlos, incluso con ingenio.

Pese a que Veo 3.1 genera vídeos con audio en español, su elección suele ser el inglés. Incluso aunque se lo remarques

Veo 3.1 ha mejorado notablemente la física de todos sus vídeos, son más reales. Respeta las texturas de los objetos, he apreciado menos alucinaciones y las voces no se notan excesivamente sintéticas. Eso sí, hay que especificarle bien el idioma, porque suele elegir el inglés. Algunos vídeos tuve que repetirlos recalcando que los quería en español: el de los gatos no me salió hasta el cuarto intento.

Gemini juega con ventaja. Si bien Sora 2 no ha salido de Estados Unidos, y su aplicación no ha llegado a Android, el lanzamiento de Veo 3.1 es global. Ya podemos generar grabaciones con Veo 3.1 en la app de Gemini y en la web. Directamente: es el modelo elegido al activar la opción de vídeo.

Pese a que llegue a casi todos los usuarios, Veo 3.1 tiene muchos más límites de uso que Sora 2. Google limita a unas pocas generaciones diarias el modelo y deja fuera a las cuentas gratuitas. Sora 2 no tiene excesivo límite en apariencia, ya que ni siquiera usándolo gratis se percibe. En cuestión de tiempos, ambas herramientas tardan más o menos lo mismo: unos tres o cinco minutos de media.

¿Y los derechos? Las herramientas de generación chocan tarde o temprano con el copyright. Eso fue lo que le pasó a Sora 2: tras unos primeros días en los que permitía generar cualquier cosa, OpenAI le pegó un tijeretazo para impedir que se genere contenido protegido por derechos de autor. Veo 3.1 parte ya limitado en este aspecto.

Veo 3.1 hace vídeos horizontales por defecto; Sora 2 prefiere los verticales: OpenAI apuesta en mayor medida por la viralidad en redes

Veo 3.1 suele negarse cuando le pides algo explícito sobre una serie o estilo concretos. Sora 2 ahora hace lo mismo, es difícil generar un vídeo donde haya elementos reconocibles y con derechos. Fuera de aquí, no hay demasiado límite más allá de que sean respetuosos y que no atenten contra las personas.

La realidad es cada vez más difusa. Tras ver los resultados de una y de otra, tengo claro que la IA ha alcanzado la realidad y, en determinados casos, hasta la supera. Caer en un vídeo sintético es cada vez más sencillo. Hay que afinar la vista y contrastar todo lo que nos encontremos por las redes de ahora en adelante.

Veo 3.1 ya está en la app de Gemini y en la web. También ha llegado a Flow, está disponible en la API de Gemini y en Vertex AI, la plataforma de desarrollo para profesionales. Google permite tres generaciones al día para cuentas Google AI Pro y cinco generaciones para AI Ultra (en la práctica los límites son más amplios). Las cuentas gratuitas no pueden generar vídeo.

Imagen de portada | Iván Linares

En Xataka Android | Uso ChatGPT y Gemini a diario, pero hay tres tareas para las que solo confío en la IA de Google