Los «datos sintéticos» impulsarán el desarrollo de la IA. Esto es lo que son y por qué son importantes

John Myers, cofundador y director de tecnología de Gretel, explica en el último episodio de Quartz AI Factor cómo los datos sintéticos serán como el aceite sintético para la IA
Synthetic data is the secret fuel accelerating AI’s revolution, exec says
Subtitles
  • Off
  • English
Es posible que se gane una comisión por los enlaces en esta página.

El matemático Clive Humby primero dijo En 2006, se afirmó que “los datos son el nuevo petróleo”: valiosos, pero inutilizables si no se refinan. Al igual que el petróleo, los datos también tienen una contraparte sintética que impulsará el futuro de la inteligencia artificial, según el cofundador y director de tecnología de Gretel, John Myers.

“Creo que los datos sintéticos serán básicamente el combustible subyacente que impulsará el desarrollo de los sistemas de IA y, específicamente, los datos que se incluyen en ellos”, dijo Myers en el último episodio de Quartz AI Factor, una serie de videos ambientada en Nasdaq MarketSite (NDAQ).

Gretel proporciona datos sintéticos a las empresas para mejorar los modelos de IA y aprendizaje automático. Los datos proporcionan la base para el desarrollo de sistemas y el entrenamiento de modelos para hacer que la IA sea más inteligente y más efectiva con cada uso.

“Veo los datos sintéticos de forma muy similar a como se ve el aceite sintético”, dijo. “Todos los que conducen un automóvil hoy en día usan aceite sintético. Simplemente saben que es como el aceite real, pero está fabricado y tiene cualidades garantizadas que aseguran que el motor pueda funcionar sin problemas”.

Los datos sintéticos funcionan de manera muy similar. Hay dos maneras de crear datos sintéticos. La primera es tomar los datos existentes y hacerlos seguros para su uso, reduciendo el volumen, haciéndolos portátiles y eliminando los riesgos de privacidad, explicó Myers. La otra es hacerlos “desde cero”, dijo, generando datos que no existen para resolver problemas y crear nuevos productos.

Imagen para el artículo titulado Los «datos sintéticos» impulsarán el desarrollo de la IA. Esto es lo que son y por qué son importantes
Imagen: Khanchit Khirisutchalual (Getty Images)

La consultora Gartner ha estimado que el 60% de los datos utilizados para IA y análisis se generarían de forma sintética para 2024. El mercado de generación de datos sintéticos es pronosticado crecerá a $2.1 mil millones en 2028, desde $381.3 millones en 2022, según BCC Research.

La privacidad es uno de los principales argumentos de venta de los datos sintéticos, en particular en sectores altamente regulados como los servicios financieros y la atención médica, que manejan mucha información personal confidencial. Pero los datos sintéticos también pueden ayudar a llenar vacíos donde faltan datos del mundo real y complementar datos producidos orgánicamente que están desactualizados o son de mala calidad.

Pero Myers no cree que los datos sintéticos reemplacen a los datos sin procesar, sino que servirán como complemento de los datos y registros reales.

“Creo que lo que vamos a encontrar es que habrá un límite bastante grande que diga, cuando queramos crear aplicaciones o poner estos datos a trabajar, tomemos una versión sintética de esos datos y utilicémosla”, dijo Myers. “Y luego ahí es donde se crearán las aplicaciones en la capa empresarial, mientras que esos datos sin procesar se utilizan para refinarlos y convertirlos en datos sintéticos”.

Mira el último episodio de Quartz AI Factor arriba.

Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.

Publicidad

Publicidad