La IA Grok de Elon Musk está mejorando en matemáticas

Grok-1.5 se está poniendo al día con ChatGPT de OpenAI y Gemini de Google

Por Rocio Fabbro2 min de lecturaActualizado 29 de marzo de 2024

Grok, el chatbot de inteligencia artificial de Elon Musk, está subiendo de nivel mientras trata de ponerse al día con sus principales competidores en el modelo de lenguaje grande (LLM) arena.

xAI, la startup fundada por el empresario multimillonario Musk en julio pasado en respuesta a sus reparos con OpenAI modelo generador de beneficios, características clave lanzadas próxima versión de Grok el jueves: Grok-1.5.

La última versión del LLM (o el sistema que comprende y genera texto en lenguaje humano) tiene algunas mejoras bastante significativas, según el El anuncio se centra en las métricas de rendimiento mejoradas de Grok, un claro contraste con la marca del CEO de Grok como una sarcástico alternativa a los chatbots existentes.

La empresa ahora promociona la capacidad más sofisticada de Grok para realizar tareas de codificación y matemáticas, acercándolo a los resultados vistos con Gemini de Google $GOOGL. modelo y ChatGPT de OpenAI. En el punto de referencia MATH, una de dos medidas matemáticas que incluye la resolución de problemas desde la escuela primaria hasta la secundaria, Grok-1.5 obtiene 50,6% de precisión, dijo la compañía. Eso eso supera el score de Grok-1 23,9% . Mientras, Gemini Pro 1.5 obtuvo 58,5%, ChatGPT obtuvo una puntuación del 52,9% y Claude 3 Opus de Anthropic, que lanzado a principios de este mes, alcanzó el 61%, el más alto de todos los demás modelos de IA.

Leer más: La inversión de Amazon $AMZN de 4.000 millones de dólares en la startup de IA Anthropic es la mayor de su historia

Además de las matemáticas, Grok-1.5 también marca una mejora en las capacidades lingüísticas del modelo. El chatbot podrá comprender mejor contexto y razonamiento avanzado, con una mayor capacidad de memoria de hasta 16 veces la longitud del contexto anterior, dijo xAI.

Para ser claros: Grok todavía está por detrás de casi todos los demás modelos importantes de IA en casi todos los criterios. A pesar de las probabilidades, Musk todavía se jacta que un próximo Grok-2 “superará la IA actual en todas las métricas”, y agregó que el próximo modelo está en entrenamiento.

Los primeros probadores y los usuarios existentes de Grok en X $TWTR, que Musk compró como Twitter en octubre de 2022, podrán probar 1,5 por la próxima semana, dijo Musk en la misma publicación en el sitio.

Cuando xAI lanzó grok En noviembre, Musk facturó a la modelo como más hablador y más agradable una adición al paisaje de IA existente , con acceso a la pletora de conocimiento y personalidades sobre X.

xAI ha estado luchando para alcanzar a sus competidores bien adoptados. Tal vez para atraer a más usuarios, Musk hecho Grok de código abierto A principios de este mes. La medida se produce mientras Musk libra una disputa en curso que se convirtió en demanda con OpenAI, la compañía que Musk ayudó a fundar en 2015. y se fue tres años después por diferencias ideológicas.

Las noticias empresariales esenciales, frescas cada mañana.

Únete a más de 500.000 lectores que comienzan su día con Quartz.

Al suscribirte, aceptas nuestros Términos de servicio y Política de privacidad.