Gemini tenía el trono del vídeo y ha venido OpenAI a quitárselo. Tras comparar Sora 2 y Veo 3 creo que Google está en problemas

  • Permite cargar modelos personales para adaptar los vídeos y voces al usuario

  • El acceso a Sora 2 está limitado a Estados Unidos y se requiere invitación

Iván Linares

Editor Senior

La IA avanza tan rápido que no conviene encariñarse con las herramientas: todo es susceptible de cambiar de un día para otro. Es justo lo que ha ocurrido con Sora 2, una actualización del modelo de vídeo que OpenAI presentó ayer martes. Las creaciones son muy buenas.

Sora 2 estrena el sonido en el vídeo. OpenAI no fue la primera en crear un generador de vídeo, pero con Sora cambió por completo el panorama: sus resultados sorprendieron. Gran fidelidad a las órdenes, reales y con cierta tendencia a la alucinación. A veces exagerada. Entonces llegó Google con Veo 3 y dejó a OpenAI por los suelos.

Interfaz de Sora 2 en web

Sora 2 es la respuesta al excelente generador de vídeo integrado en Gemini. Permite clips de hasta diez segundos con resultados fieles a la realidad y al prompt, puede sintetizar voces y sonidos, permite cargar un modelo personal (cameo) y, de momento, queda limitado a Estados Unidos y bajo invitación. Están muy cotizadas.

Tan bueno, que cada vez es más difícil identificar la IA. He podido acceder a la generación de vídeo con Sora 2 y me ha parecido impresionante. El sonido queda bien encajado, las voces son bastante fieles (no siempre sintetiza perfectamente) y con un nivel de alucinaciones reducido. Se nota que OpenAI pulió bien el modelo antes de lanzarlo.

La nueva app de Sora permite crear una base con el usuario y su voz para después adaptar las generaciones a esa persona. De momento solo en iOS

Por mis pruebas iniciales, la generación de Sora 2 está por encima de la de Veo 3, tanto en calidad como en fidelidad con la orden dada. Sí lo he apreciado algo más lento, aunque seguramente influya la alta demanda de los servidores que tendrá actualmente OpenAI.

Sora 2 y Veo 3 frente a frente. Con el mismo prompt obtienen resultados diferentes sobre una base compartida. Creo que Sora 2 es más preciso, también sabe reconocer mejor los patrones para aplicarlos en la generación. Aunque se pasa de creativo: a menudo añade detalles al vídeo que no se le han pedido. No suelen quedar mal, eso sí.

A nivel de físicas diría que Gemini tiene algo de ventaja: ha interpretado mejor la disolución del líquido y su densidad. En la generación de personas y animales Sora 2 suele adelantarse.

Los 40.000 millones de la última inversión se notan. Gemini fue la respuesta a un ChatGPT que se convirtió en el estándar de chatbots con IA. A Google la pillaron fuera de juego, tuvo que recortar el espacio en apenas tres años. Lo había conseguido, por eso Open AI no puede quedarse atrás.

Si bien Google tiene el músculo de una multinacional líder en su sector, OpenAI no para de recibir inversiones: la última fue de 40.000 millones de dólares. No hay ninguna duda del destino de la mayoría del dinero, la potencia para aguantar una herramienta como Sora 2 no debe ser pequeña.

Aplicación de Sora en iOS

Un avance enorme en generación de vídeo con sonido. El nuevo Sora 2 va a ser el referente en este campo de la IA, incluso pese a que Luma Dream Machine, Adobe Firefly o el mismo Veo 3, compitan con muy buenos resultados. ChatGPT tiene más de 700 millones de usuarios semanales según sus propios datos. Y cualquiera con una cuenta puede acceder a Sora 2 si tiene invitación y reside en Estados Unidos. Este último punto se soluciona con una VPN, doy fe.

Los resultados de Sora 2 suelen ser mejores y más fieles que los de Veo 3 en Gemini, el vídeo que hizo conmigo capturando un Pikachu está muy conseguido. Y es una excelente noticia: eso significa que Google va a ponerse las pilas con el próximo Veo 4 y Gemini 3. Que haya competencia en el mundo de la IA es muy positivo para quienes la utilizamos.

Imagen de portada | Gemini editada

En Xataka Android | Lo que costaba dinero y mucho tiempo ahora Gemini lo hace en segundos y gratis: he dejado sin palabras restaurando fotos

Ver todos los comentarios en https://www.xatakandroid.com

VER 0 Comentario