OpenAI presenta o3, su próximo modelo de ‘razonamiento’

La startup de inteligencia artificial dijo que planea lanzar o3-mini a fines de enero

Por Britney Nguyen2 min de lecturaActualizado 20 de diciembre de 2024

OpenAI finalizó su ola de lanzamiento de productos “12 días de OpenAI” al presentar el sucesor de su primer producto. modelo de “razonamiento”.

La nueva familia de modelos Frontier incluye o3 y o3-mini, dijo el viernes la startup de inteligencia artificial. Ninguno de los modelos se ha lanzado públicamente todavía, pero ahora están Disponible para pruebas de seguridad pública.

“Vemos esto como una especie de comienzo de la siguiente fase de la IA, donde se pueden usar estos modelos para realizar tareas cada vez más complejas que requieren mucho razonamiento”, dijo el director ejecutivo de OpenAI, Sam Altman, durante un anuncio transmitido en vivo.

La startup de inteligencia artificial se salta el nombre 02, dijo Altman, “por respeto a nuestros amigos de Telefónica”.TEF), y en la gran tradición de OpenAI que es realmente malo con nombres». O2, una marca de Telefónica de España, es un operador de red móvil en el Reino Unido.

Por primera vez, OpenAI está abriendo los modelos para pruebas de seguridad externas. Los investigadores de seguridad pueden registrarse para obtener una vista previa y probar los modelos, dijo Altman, y agregó que la startup planea lanzar o3-mini a fines de enero, seguido por el modelo o3 completo poco después.

En comparación con el 01 y el o1-mini, que se lanzaron en septiembre, el o3 superó al o1 en casi 23 puntos porcentuales en el Verificado por SWE-Bench evaluación, y alcanzó una calificación de Codeforces de 2727, dijo OpenAI. La prueba anterior es una evaluación interna, así que tómela con cautela. Mientras tanto, el científico jefe de OpenAI obtuvo una puntuación de 2665, según la startup. El nuevo modelo también estableció un récord en la evaluación Frontier Math de EpochAI, dijo OpenAI, y aparentemente más que triplicó la puntuación de o1 en la prueba ARC-AGI.

OpenAI lanzó la versión completa de su o1 modelo fuera de vista previa durante el primer día de su programa promocional “12 días de OpenAI”. La startup también anunció un nuevo nivel de suscripción de $200 al mes para ChatGPT llamado ChatGPT Pro, que incluye una versión más avanzada de o1 llamada o1 pro mode.

Las noticias empresariales esenciales, frescas cada mañana.

Únete a más de 500.000 lectores que comienzan su día con Quartz.

Al suscribirte, aceptas nuestros Términos de servicio y Política de privacidad.