Open AI revienta el día grande de Google con Gemini 1.5: Sora puede crear vídeos increíbles con una frase

  • Sora es capaz de crear vídeos de cero, animar imágenes o ampliar la duración de vídeos reales

  • Funciona con todo el fondo de armario de los creadores de ChatGPT

Sora Open AI
Sin comentarios Facebook Twitter Flipboard E-mail

Febrero iba a ser el mes en el que Google estaba llamado a ser protagonista, pero Open AI está empeñada en reventar la situación. Este mes, Google anunció por fin Gemini como remplazo para Bard. La nueva inteligencia artificial tiene un motor más potente detrás, cuenta con aplicación dedicada y hasta una versión de pago llamada Gemini Advanced.

Sin embargo, la empresa no para y ayer presentaron Gemini 1.5 por todo lo alto. ¿La promesa? un 87% de superioridad frente a Gemini Pro 1.0 y un rendimiento mucho mejor que GPT-4. Lo que no esperaban era que Open AI, los padres de ChatGPT, anunciaran la IA de vídeo generativo más bestia que hemos visto hasta el momento. Y sí, todo el mismo día que Google estaba presentando su nueva versión de Gemini. Se trata de Sora y los primeros ejemplos son… impactantes.

Sora es un generador de vídeo a partir de texto, y es brutal

Cuando hablamos de empresas punteras en inteligencia artificial generativa, Open AI es una de las que primero viene a la mente. El motivo es que cuentan con ChatGPT, una IA de texto que no sólo responde rápidamente, sino que analiza muy bien el contexto (mucho mejor que Gemini, al menos en nuestras pruebas).

También cuentan con DALL·E, una IA que fue de las pioneras en la generación texto a imagen y que sí, fue eclipsada por otras como Stable Diffusion o Midjourney, pero que con la nueva versión volvió por la puerta grande. El vídeo, sin embargo, es algo más complicado.

En la generación de vídeo a partir de un prompt de texto entran en juego muchísimos factores debido a que no se trata de una imagen estática, sino de una con movimiento en la que hay que simular iluminación, texturas, animaciones, físicas y partículas. Es muy complicado que una IA generativa de vídeo ofrezca un resultado convincente, pero aun así había algunos motores que hacían un trabajo decente.

Ahora, han quedado en un segundo plano debido a Sora. Open AI ha tardado en presentar su IA de texto a vídeo, pero lo ha hecho por la puerta grande. Sora puede crear vídeos de hasta 60 segundos con un simple comando de texto. En este sentido, es exactamente igual que los generadores de imágenes y, cuanto más detalle añadamos a la orden, más rica será la escena.

En la web de Open AI hay varios ejemplos (que te recomendamos ver atentamente) y algunos de ellos son muy interesantes. El más llamativo por su complejidad es el de la mujer que va andando por Tokio.

El prompt es el siguiente:

"Una mujer elegante camina por una calle de Tokio llena de neones brillantes y letreros. Viste una chaqueta de cuero negra, un vestido largo rojo, botas negras, y lleva un bolso negro. Usa gafas de sol y pintalabios rojo. Camina con confianza y de manera relajada. La calle está mojada y refleja, creando un efecto de espejo de las luces. Muchos peatones caminan por la zona".

Y el vídeo es el que te dejamos a continuación:

En vídeos de personas, lo cierto es que es impresionante lo bien que refleja las expresiones y la iluminación, pero lo más espectacular son las vistas de dron. Hay varios ejemplos en lo que ha mostrado Open AI, pero este de Santorini es espectacular:

Ahora bien, si echamos un ojo al resto de ejemplos, podemos ver vídeos tan impresionantes como inquietantes, sobre todo cuando hay elementos superpuestos o manos. O, directamente, este que te dejamos a continuación, que es bastante extraño:

De momento, Sora está siendo probado en los laboratorios de Open AI, pero sus responsables afirman que, además del vídeo generado a través de un comando de texto, también se podrá expandir un vídeo existente o crear un vídeo a partir de una fotografía utilizando un sistema generativo similar al de DALL·E 3.

Veremos lo que tarda Sora en llegar a los usuarios y, sobre todo, estaremos pendientes de la respuesta de una Google que se mostraba eufórica con su nuevo Gemini… y a la que le han robado todos los focos. Otra vez.

Foto de portada | Sora

En Xataka Android | Cómo desbloquear y recuperar tu Android si has olvidado el patrón o la contraseña

Inicio