No es solo AbiertoAIDespués de todo, es el mundo de los modelos de lenguajes grandes (LLM).
Sin duda, el GPT-4 de OpenAI, su último modelo lanzado en marzo, es muy superior en el mercado, en parte debido a lo mucho más amplio que es su modelo que el de sus competidores. El LLM de OpenAI, que impulsa chatbots como ChatGPT, se puede aplicar para proporcionar una gran cantidad de información como estadísticas de béisbol o consejos para reanudar. Pero en medio de una industria en rápido movimiento, las empresas que crean aplicaciones de IA están diversificando sus dependencias de LLM, poniendo a prueba los límites del dominio de OpenAI en el industria de IA generativa.
Cuando se trata de alterar OpenAI, “muchas personas inteligentes con mucho dinero lo están intentando, por lo que podemos esperar que eventualmente cambien en algún momento”. el próximo año”, dijo Alexandre Lebrun, director ejecutivo de Nabla, una startup con sede en París que construye un software de toma de notas con IA para entornos clínicos.
El creciente mercado de proveedores de LLM
Eso se produce cuando las grandes empresas tecnológicas como Meta y Google están ofreciendo sus propios LLM. Y, junto con las empresas emergentes como Anthropic, Stability AI y Mosaic, las empresas de IA tienen una gran cantidad de modelos para elegir. .
Dada la alta velocidad de la industria de la IA, las empresas han comenzado a utilizar múltiples LLM para reducir los riesgos de que otros actores mejoren que OpenAI, y los posiciona para adaptarse rápidamente si ese llega a ser el caso.
Por ejemplo, la empresa de telecomunicaciones y redes Cisco tiene contratos con varios proveedores de LLM, incluidos OpenAI y Google, y está abierta a adquirir más “Lo que encontramos es que no existe un solo modelo que funcione bien para cada escenario”, Anurag Dhingra, jefe de Cisco. oficial de tecnología, le dijo a Quartz. Agregó que Cisco prueba regularmente los LLM para ver cómo se desempeñan. Para resumir casos de uso, por ejemplo, La empresa opta por GPT 3.5. Pero para evaluar las tendencias en las llamadas de los clientes, basta con un modelo más pequeño; la empresa utiliza sus propios modelos o de código abierto que afina.
“En lugar de elegir un [modelo] y decir este es el Un anillo Para gobernarlos a todos, estamos adoptando un enfoque más flexible”, dijo Dhingra.
Cisco es solo una de las muchas empresas que utilizan IA y que han estado desarrollando su producto para brindar flexibilidad. La conclusión: si un LLM supera a otros En calidad, pueden conectar fácilmente el nuevo modelo a su producto de IA para seguir siendo competitivos.
Modelos más baratos de empresas como Meta y Mosaic están en el mercado
Para otras empresas, en particular las startups con problemas de liquidez que utilizan LLM para impulsar sus productos, todo se reduce a ahorrar dinero, en particular, como capacitación en IA. Los modelos pueden incurrir en altos costos computacionales. Ese es el caso de empresas emergentes con problemas de liquidez como Numerade, una empresa de educación en línea con sede en Los Ángeles que está construyendo una Tutor de IA.
Para reducir costos, esas empresas a menudo utilizan una combinación de proveedores de LLM que son menos costosos que los de OpenAI y luego los ajustan para cumplir sus necesidades. Es especialmente efectivo cuando una empresa tiene datos patentados, dijo Alex Lee, CTO de Numerade, que utiliza una combinación de LLM proveedores incluidos Google, Meta, Mosaic, Anthropic, entre otros.
Alta demanda de servicios de OpenAI
También hay preocupaciones más inmediatas que abordar, como las limitaciones de capacidad para el entrenamiento de modelos de IA.
Por ejemplo, con la alta demanda de GPT-4 de OpenAI, los servidores pueden alcanzar su capacidad total, lo que requiere GPU adicionales para funcionar de manera efectiva y todas las rutas llevó a Nvidia, que ha tenido su problema de demanda propia. Y cuando una startup está ampliando sus clientes, garantizar el acceso ininterrumpido a GPT-4 se vuelve crucial. En esas situaciones las empresas se están encontrando trabajando sus conexiones con corporaciones más grandes, como Microsoft, que alberga el modelo de OpenAI, para asegurar capacidad adicional.
“[Si] usted es HP o IBM o un cliente muy importante, obtendrá lo que desea para su personal de trabajo en Microsoft, pero si usted es simplemente una empresa normal, puede ser muy, muy difícil obtener la capacidad adecuada”, dijo Lebrun. Sobrecarga de capacidad, la empresa utiliza LLM de código abierto de Meta y Mistral.
Agregó que el uso de diferentes modelos protege contra el riesgo de futuros aumentos de precios por parte de OpenAI, que puede comenzar a aumentar las tasas cuando comience la competencia. para ponernos al día.
Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.