OpenAI presenta o3, su próximo modelo de ‘razonamiento’

La startup de inteligencia artificial dijo que planea lanzar o3-mini a fines de enero

Es posible que se gane una comisión por los enlaces en esta página.
Sam Altman, con una sudadera gris verdosa, sonriendo y mirando hacia algo
Sam Altman, director ejecutivo de OpenAI, en Fox Business Network Studios el 4 de diciembre de 2024 en la ciudad de Nueva York.
Foto: Mike Coppola (Getty Images)

OpenAI finalizó su ola de lanzamiento de productos “12 días de OpenAI” al presentar el sucesor de su primer producto. modelo de “razonamiento”.

Publicidad

La nueva familia de modelos Frontier incluye o3 y o3-mini, dijo el viernes la startup de inteligencia artificial. Ninguno de los modelos se ha lanzado públicamente todavía, pero ahora están Disponible para pruebas de seguridad pública.

“Vemos esto como una especie de comienzo de la siguiente fase de la IA, donde se pueden usar estos modelos para realizar tareas cada vez más complejas que requieren mucho razonamiento”, dijo el director ejecutivo de OpenAI, Sam Altman, durante un anuncio transmitido en vivo.

Publicidad

La startup de inteligencia artificial se salta el nombre 02, dijo Altman, “por respeto a nuestros amigos de Telefónica”.TEF-0.74%), y en la gran tradición de OpenAI que es realmente malo con nombres». O2, una marca de Telefónica de España, es un operador de red móvil en el Reino Unido.

Publicidad

Por primera vez, OpenAI está abriendo los modelos para pruebas de seguridad externas. Los investigadores de seguridad pueden registrarse para obtener una vista previa y probar los modelos, dijo Altman, y agregó que la startup planea lanzar o3-mini a fines de enero, seguido por el modelo o3 completo poco después.

Publicidad

En comparación con el 01 y el o1-mini, que se lanzaron en septiembre, el o3 superó al o1 en casi 23 puntos porcentuales en el Verificado por SWE-Bench evaluación, y alcanzó una calificación de Codeforces de 2727, dijo OpenAI. La prueba anterior es una evaluación interna, así que tómela con cautela. Mientras tanto, el científico jefe de OpenAI obtuvo una puntuación de 2665, según la startup. El nuevo modelo también estableció un récord en la evaluación Frontier Math de EpochAI, dijo OpenAI, y aparentemente más que triplicó la puntuación de o1 en la prueba ARC-AGI.

OpenAI lanzó la versión completa de su o1 modelo fuera de vista previa durante el primer día de su programa promocional “12 días de OpenAI”. La startup también anunció un nuevo nivel de suscripción de $200 al mes para ChatGPT llamado ChatGPT Pro, que incluye una versión más avanzada de o1 llamada o1 pro mode.

Publicidad

Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.

Publicidad