Las empresas de etiquetado de datos están subiendo los precios en el auge de la IA

Los chatbots de IA requieren una gran cantidad de datos de alta calidad y ahora cuestan más

Es posible que se gane una comisión por los enlaces en esta página.
Una imagen sin fecha de la startup estadounidense Replika muestra a un usuario interactuando con una aplicación de teléfono inteligente para personalizar un avatar para una inteligencia artificial personal. chatbot, conocido como Replika, en San Francisco, California, Estados Unidos
Los avatares todavía tienen un aspecto tosco.
Foto: Luka, Inc./Handout via Reuters (Reuters)

¿Necesita otro indicador de que la industria de la inteligencia artificial generativa es real y está progresando? Mire el floreciente negocio del etiquetado y anotación de datos. lo cual es un paso esencial en la capacitación de los modelos que impulsan los productos de IA, desde lo que actualmente está de moda en la industria (¡chatbots!) hasta lo que está de moda en la actualidad. proyectos como vehículos autónomos y herramientas que diagnostiquen enfermedades.

Publicidad

Durante el paso de etiquetado de datos, por lo general, un equipo de humanos identificará los puntos de datos, ya sea la gravedad del daño en 100 000 fotos. de diferentes autos para una compañía de seguros, o los sentimientos de las personas que interactúan con agentes de soporte para una empresa de servicio al cliente. Anotación de datos Es un paso crítico en el entrenamiento de modelos en lenguaje grande (LLM, por sus siglas en inglés) como GPT de OpenAI porque hace que los modelos de IA sean más precisos.

Tras el lanzamiento de ChatGPT por parte de OpenAI en noviembre pasado, las empresas de anotación de datos han recibido tanta demanda que está empujando a algunas de ellas a aumentar los precios. .

Publicidad

Realeyes es una empresa con sede en Londres que utiliza la visión por ordenador para leer y comprender el comportamiento humano; esos datos se utilizan luego para mejorar la publicidad. efectividad o minimizar el fraude de identidad. Dado que la empresa estaba recopilando y etiquetando datos para sus propios algoritmos de visión por computadora, decidió dos hace años para pasar a un servicio análogo de etiquetado de datos para otras empresas, , dijo Mihkel Jäätma, el CEO de Realeyes, que trabaja con más de 200 empresas de medios, tecnología y publicidad.

Publicidad

El servicio de etiquetado de datos comenzó a generar ingresos el año pasado y el negocio se volvió “muy grande y muy rápidamente”, dijo. Jäätma estima que El 80% del negocio proviene de empresas que esencialmente buscan hacer que los avatares sean menos caricaturescos. ha sido parte de nuestro negocio sólo en los últimos dos años y sigue adelante ”, dijo.

Publicidad

Desde grandes empresas tecnológicas hasta startups de IA bien financiadas, “[l]a inversión que vemos es que esto va a estar superpuestos con [características] muy humanas”, dijo. En otras palabras, el trabajo ahora es hacer estos avatares, robots que exhibir personalidades basadas en personajes inventados o personas reales: comprender a los usuarios y hablar de una forma más humana.

Desde el lanzamiento de su servicio de etiquetado de datos, Realeyes ha aumentado los precios al menos dos veces. Jäätma dijo que ha tenido que decirle a sus clientes que si no estaban dispuestos a pagar, Realeyes no completaría la solicitud completa.

Publicidad

Hacer avatares más humanos

Etiquetar grabaciones de audio y visuales es complejo. No se trata solo de datos extraídos de Internet. Los anotadores humanos trabajan para evaluar las emociones de las personas, por ejemplo —y a medida que ese trabajo se vuelve más matizado, significa pagar más a los anotadores. (Según se informa, Realeyes contratado por Meta para hacer los avatares del gigante tecnológico, que desplegó su propios avatares de IA en septiembre, más humano.)

Publicidad

Mientras tanto, Snorkel AI, una empresa especializada en etiquetado de datos, dijo que el número de consultas que recibió en los últimos tres meses fue más de cinco veces el número total recibido durante todo el año anterior, con solicitudes provenientes de empresas emergentes en etapa inicial que construyen modelos en idiomas grandes ( LLM), así como agencias gubernamentales y empresas de TI.

La empresa con sede en Redwood City, California, no ha aumentado los precios, pero ha implementado ofertas de servicios adicionales en torno a la capacitación en inteligencia artificial según las necesidades de los clientes. se han diversificado.

Publicidad

El etiquetado de datos ya es una industria de 2.200 millones de dólares

El crecimiento en el etiquetado de datos muestra que las aplicaciones de IA generativa están progresando. “Con ChatGPT y otros desarrollos, las aplicaciones de IA no son fuera de nuestro alcance”, afirmó Devang Sachdev, vicepresidente de marketing de Snorkel AI. El aumento de los productos de IA se produce a medida que los LLM de la Los Me gusta de Google y OpenAI también se han vuelto mucho más accesibles.

Publicidad

El mercado global de recopilación y etiquetado de datos alcanzó los 2.200 millones de dólares en 2022 y se espera que crezca casi un 30 % entre 2023 y 2030. de acuerdo a a la firma de investigación de mercado Grand View Research.

Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.

Publicidad