Sora creacion de videos

SORA: La herramienta de OpenAI para crear videos espectaculares

El software Sora desarrollado por la empresa y mostrado en plataformas online tiene la capacidad de generar videos de excelente calidad a partir de solicitudes básicas expresadas en texto.

Después del impacto de ChatGPT y otras herramientas de inteligencia artificial generativa para el procesamiento de lenguaje, OpenAI ha introducido una innovadora y deslumbrante aplicación de creación de videos llamada Sora.

Dall-E puede generar imágenes que son prácticamente idénticas a una fotografía, mientras que ChatGPT responde de manera similar a un humano. OpenAI, la empresa responsable de estas inteligencias artificiales, había estado buscando incursionar en el campo del vídeo. Ahora, también pueden afirmar haberlo logrado.

Ballenas y tiburones hecho por SORA

La más reciente adición al arsenal de herramientas de inteligencia artificial de la compañía es Sora, un modelo que puede producir secuencias de vídeo de alta calidad a partir de descripciones simples en texto.

Esta herramienta permite generar clips simplemente proporcionando una descripción de lo que se desea ver en la pantalla, utilizando inteligencia artificial para su creación. Aunque algunos pueden tener un estilo similar a los videojuegos que los distingue de la realidad, todos resultan asombrosos.

Sam Altman, CEO de OpenAI, anunció el lanzamiento de Sora en la red social X, que rápidamente se inundó con las nuevas creaciones. Desde videos realistas hasta futuristas, extravagantes y de animación, la variedad de contenido es amplia. Sora es capaz de generar videos completos de una sola vez o extender los existentes para hacerlos más largos.

Durante las demostraciones realizadas por Altman y su equipo, se han exhibido escenas complejas que incluyen múltiples personajes, movimientos específicos y detalles minuciosos tanto del sujeto como del entorno.

Según OpenAI, el modelo no solo comprende lo solicitado por el usuario, sino también cómo esos elementos existen en el mundo físico. Este modelo posee un profundo entendimiento del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes cautivadores que expresan emociones vibrantes, como explica la empresa.

Los predecesores de Sora

Herramientas como Runway: Gen2 y la misma herramienta Pika, hasta la ultima herramienta de Google Video Poet dan resultados que llegan a ser cómicos, carne de memes. A las manos les crecen dedos, la ropa cambia de color e incluso de talla y corte.

Un vídeo especialmente gracioso que circula por la red, muestra una recreación del actorWill Smithcomiendo espagueti en el que la pasta parece tener vida propia.

¿Cómo funciona Sora?

Las instrucciones pueden variar en nivel de detalle. Pero la mecánica es la misma usada para Chat GPT. Debes escribir un texto que viene a ser el promtp que la herramienta procesara.

Un ejemplo proporcionado por OpenAI responde a la siguiente descripción: «Una mujer elegante camina por una calle de Tokio iluminada por brillantes neones y una vibrante señalización urbana. Viste una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Usa gafas de sol y lápiz labial rojo. Su paso es firme y relajado. La calle está mojada y refleja las luces de colores como un espejo, con muchos peatones paseando». El resultado es impresionante.

Aparte de crear un video basándose únicamente en instrucciones de texto, el modelo tiene la capacidad de tomar una imagen estática existente y transformarla en un video, animando con precisión y cuidado los elementos presentes en la imagen, prestando atención a los detalles más pequeños. También puede expandir o rellenar los fotogramas faltantes de un video existente. Vean este donde Sora puede interpolar videos de una forma asombrosa.

Indica Sam Altman: “Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real”,explica OpenAI al presentar la nueva herramienta de conversión de texto a vídeo.“Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y la fidelidad a las indicaciones del usuario”, añade.

Leer El Impacto de Chat GPT: Aumento Exponencial del Phishing en el Mundo de la Ciberseguridad.

Quienes pueden usar Sora?

Actualmente, la herramienta está disponible para lo que se conocen como «equipos rojos». Estos equipos están dedicados a poner a prueba un producto o servicio de manera rigurosa, desafiándolo al máximo y buscando sus debilidades como si fueran adversarios de la empresa.

Su tarea específica es evaluar áreas críticas en busca de posibles daños o riesgos. Entre los integrantes de estos equipos se encuentran expertos en campos como la desinformación, contenidos que incitan al odio y sesgo.

¿Qué podemos esperar?

El modelo comparte las mismas restricciones que Dall-E, el generador de imágenes estáticas. No tiene la capacidad de producir vídeos con personas reales, ni contenido de naturaleza sexual o violenta.

Sora presenta defectos, sin embargo, logra escenas mucho más realistas que la mayoría, y lo que es más importante, de una duración mayor, incluso de hasta un minuto. Los videos también tienen una resolución satisfactoria, equivalente a 1080p.

Algunos de los ejemplos mostrados por OpenAI en su sitio web son verdaderamente impresionantes y, si no se prestan atención a los detalles, son prácticamente indistinguibles de un video real.

El motor también es capaz de crear escenas convincentes de animación tridimensional o combinar objetos realistas con otros claramente generados por computadora. La autenticidad de los resultados subraya nuevamente el potencial de estas herramientas en campañas de desinformación.

Deja en los comentarios tu opinión sobre la utilización de esta innovadora herramienta. Si deseas ver los prompts y los videos que se han generados directamente de OpenAI, visita este sitio. https://openai.com/sora

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio
×