Cómo el nuevo generador de vídeos de OpenAI, Sora, podría cambiar los vídeos

Las posibilidades son ilimitadas: desde hacer vídeos de TikTok más fácilmente hasta recrear simulaciones para coches autónomos.

Por Michelle Cheng4 min de lecturaActualizado 16 de febrero de 2024

Add QZ to Google

OpenAI logró su gran caída ayer— liberando a sora, un generador de IA de texto a video que puede crear videos realistas. Sora puede generar escenas realistas e imaginativas a partir de instrucciones de texto, arriba a un minuto de duración, según la empresa. Si tomamos los vídeos que OpenAI ha publicado en su sitio “sin modificaciones”, como afirma, los videos son realmente notables , y quizás ayudan a explicar el nombre del sistema de IA , que significa “cielo” en japonés . Como en , el cielo es verdaderamente el límite.

Sora aún no está disponible para el público. Por ahora, OpenAI dijo que el generador de IA solo estará disponible para los llamados equipos rojos. o profesionales de ciberseguridad, quienes evaluarán áreas críticas en busca de daños o riesgos. OpenAI también está otorgando acceso a algunos artistas visuales, diseñadores y Los cineastas obtendrán retroalimentación sobre cómo hacer avanzar el modelo de IA para que sea “más útil” para los profesionales creativos.

Con esto, las posibilidades de lo que podría hacer un creador de videos cortos generados por IA son ilimitadas.

Por un lado, la brevedad de los videos hará que sea mucho más fácil crear videos de TikTok y YouTube, dijo Jun-Yan Zhu, un Profesor de la Universidad Carnegie Mellon que investiga la IA generativa.

Con el tiempo, la IA también podría alterar las películas de Hollywood. Los cineastas “quieren un control más preciso de la animación y la emoción”, afirmó. El modelo de IA de texto a video también ayuda a poner en contexto por qué Escritores y actores de Hollywood Hemos exigido derechos y pagos en medio del auge de la IA generativa, antes de que sea demasiado tarde.

Sora también podría utilizarse para la generación 3D cuando se trata de simular robótica y coches autónomos, lo que requiere una tonelada de datos de entrenamiento — que tiene en cuenta semáforos o accidentes de autos — y que es costoso de adquirir, lo que explica en parte por qué la adopción de Los coches autónomos siguen estando fuera de su alcance.

Se acerca cada vez más el día en el que no podremos diferenciar un vídeo que represente la vida real y uno que aparentemente capture realidad. “Podría ser difícil para los ojos humanos diferenciar manualmente, podría ser plausible que un algoritmo notara la diferencia”, dijo .

La responsabilidad de las empresas tecnológicas en la nueva era de la IA

No sería una sorpresa si Google $GOOGL y Microsoft $MSFT también estuvieran creando internamente modelos similares de conversión de texto a vídeo. Con las herramientas de IA generativa cada vez más Las empresas de tecnología más sofisticadas han estado anunciando una serie de actualizaciones en lo que respecta al etiquetado de contenido generado por IA. Los investigadores de las empresas de tecnología están también trabajando en Herramientas de detección forense de IA.

También es difícil no imaginar que el llamativo anuncio de OpenAI podría significar problemas para las empresas que trabajan en el espacio de generación de vídeos de IA. Competidores Incluyen Runway, que ha recaudado más de 234 millones de dólares de empresas como Google y Nvidia $NVDA, e Irreverant Labs, respaldado por Andreessen Horowitz, que ha recaudado más de 80 millones de dólares en financiación. Cuando se le preguntó acerca de Sora, el CEO Rahul Sood dijo en un correo electrónico: “Sora se ve genial, es el primer competidor real de lo que estamos construyendo. Es impresionante ver que lo que estamos trabajando es posible”. todavía no ha lanzado su herramienta al público, pero dice que se está “acercando”.

Entonces, ¿qué hace que los vídeos falsos de OpenAI sean tan buenos?

El generador de vídeo de IA está respaldado por los modelos en lenguaje amplio de OpenAI, que son modelos masivos entrenados con toneladas de datos de Internet para generar nuevo contenido. Uno gran debate En este momento en la industria de la IA es si las empresas de IA deben acreditar y pagar a las personas que producen las películas, videos, fotografías y animaciones, que se utilizan para entrenar los modelos de IA .

El otro problema es que OpenAI y otros se niegan a ser más transparentes sobre lo que implican estos modelos, alegando “razones competitivas”.

¿Esto alimentará las falsificaciones profundas?

Sí, en pocas palabras, dijo Zhu. Existe una preocupación real acerca de cómo, cuando alguien pueda tener en sus manos la última herramienta OpenAI, Será más fácil crear deepfakes y contenido ofensivo. Ya ha habido varios deepfakes negativos de alto perfil que han llegado a los principales medios de comunicación incluyendo fotos explícitas de Taylor Swift en X $TWTR y un falso El presidente Joe Biden informa a los potenciales votantes en las primarias en New Hampshire para quedarse en casa y “salvar su voto” saltándose las elecciones primarias del estado el mes pasado.

Las noticias empresariales esenciales, frescas cada mañana.

Únete a más de 500.000 lectores que comienzan su día con Quartz.

Al suscribirte, aceptas nuestros Términos de servicio y Política de privacidad.