Kliver
Kliver
Escrito
22 Dic, 2025
6 min de lectura

La Economía del Dato: el cuello de botella de la IA

La Economía del Dato: el cuello de botella de la IA

Estamos viviendo en la era de la IA. Nunca en toda la historia ha surgido una tecnología tan novedosa. Laboratorios de IA, como Anthropic, OpenAI y otros, están empezando a jugar un papel más preponderante en nuestras vidas.

Estamos viviendo en la era de la IA. Nunca en toda la historia ha surgido una tecnología tan novedosa. Laboratorios de IA, como Anthropic, OpenAI y otros, están empezando a jugar un papel más preponderante en nuestras vidas. Y sin embargo, ¿cómo funciona este negocio? ¿Quiénes son los actores clave en este mercado y cómo interactúan entre sí? Imagenportada En este nuevo mundo, uno de los principales cuellos de botella en la industria es el Dato. Y no cualquier tipo de dato, sino datos de alta calidad. Datos que realmente reflejan la intención humana y la comprensión de la realidad, más allá de una mera interpretación de la misma. De hecho, creemos que el Dato es tan importante que comprender la Industria de Datos de la IA es la piedra angular para entender la evolución actual de la IA y su impacto en el futuro del trabajo. En este artículo, nuestro objetivo es proporcionar una comprensión clara de la industria actual de datos de IA, sus principales actores, su papel y lo que podemos esperar de este mercado.

La Economía del Dato no es solo Laboratorios de IA

¿Qué tienen en común todos los Laboratorios de IA? Necesitan GPUs y necesitan Datos. Sin Datos, simplemente están construyendo una máquina que no tiene suficiente combustible. Una vez que han escalado sus sistemas, necesitan mejorar constantemente sus modelos para que funcionen cada vez mejor. Pero, ¿cómo se hace esto? ¿Cuál es la diferencia entre un buen combustible y un mal combustible? Su calidad. Para entrenar mejores modelos (ya sea de lenguaje, imagen o video), los Laboratorios de IA necesitan entradas perspicaces y útiles. No solo un simple clickbait, sino una respuesta elaborada y articulada, que ponga a prueba el límite de los modelos y presente información sobre cómo actuar en la última milla donde los modelos tienden a fallar, que no es otra que los escenarios de interpretación subjetiva o libre.

Y si bien la mente humana no es tan eficiente como una computadora para calcular algo, está especialmente bien entrenada para lidiar con la complejidad y la dualidad de la realidad. Y ese es el margen que el humano puede proporcionar a los modelos. Los modelos actuales utilizan el Aprendizaje por Refuerzo para su supervisión, un método que consiste en que una salida de IA es evaluada e informada de vuelta a la IA por otra entidad para mejorarla. Esta técnica de mejora ha demostrado una mejora considerable cuando un humano es quien revisa la salida, mostrando incluso un 20% a 30% en la respuesta de los modelos, esto se conoce como la Técnica de Aprendizaje por Refuerzo con Human-In-The-Loop (HITL).

Es una de las necesidades clave de los modelos para escalar. Esta técnica compite con otras, como los Datos Sintéticos y Machine-In-The-Loop (que es utilizada por los laboratorios de IA). En esta nueva fiebre del oro, los que controlan el suministro de Datos para los modelos son actores clave. Y están en la parte inferior de la cadena, alimentando los modelos que usamos todo el día. Pero, ¿quiénes son? ¿Y cómo se organizan?

El Mercado de Datos tiene cuatro actores clave:

- Recopiladores de Datos: Adquisición de Datos Brutos - - Anotadores de Datos: Etiquetado de Datos para el entrenamiento -Síntesis y Gestión: Datos sintéticos y plataformas -Laboratorios de IA: I+D de Modelos

Cada uno de estos sectores tiene un papel que desempeñar en la Economía de Datos

Mientras los Recopiladores de Datos trabajan y el nuevo Lugar de Trabajo para los humanos, ayudándolos a mejorar la IA, los Recopiladores de Datos se enfocan en limpiar, refinar y almacenar los datos de tal manera que los laboratorios de IA puedan utilizarlos. El eslabón secundario del mercado son las empresas de Soporte de Operaciones, como los datos sintéticos y las plataformas de gestión de datos. Los datos sintéticos se utilizan en la mayoría de las operaciones, e incluso cuando ayudan a mejorar las métricas, su impacto actualmente es de solo alrededor del 5%.

El auge de la IA está aquí, simplemente no está distribuido de manera uniforme

Mucha gente se pregunta hoy en día sobre el verdadero impacto que la IA está teniendo en la economía, si es solo ruido, o si estamos viendo una verdadera evolución en la tecnología, después de todo, no podemos olvidar que los inviernos de la IA de décadas pasadas, las fases de estancamiento de esta tecnología duraron más de 20 años. Esta vez, sin embargo, parece que la industria de la IA está creciendo, y podría ser el único mercado fuerte en un momento tan volátil. La IA no se parece a nada que hayamos visto. Los números no mienten, el mercado de Datos de IA ha estado creciendo constantemente en los últimos años.

La industria general de la IA espera un crecimiento explosivo, con proyecciones de USD 254-391 mil millones en 2025 hasta USD 1.8-4.8 billones para 2030-2033, a una CAGR del 29-44%, impulsado por la IA generativa, la computación de borde y la adopción en sectores como la atención médica y las finanzas. Para el negocio de datos de IA, se anticipa una CAGR del 21-27%, con el mercado de anotación creciendo USD 1.4 billones de 2025 a 2029, debido a la demanda de datos éticos y trazables. Los debates incluyen el cambio a datos sintéticos (reduciendo la dependencia humana en un 20-30% para 2030) versus la necesidad de anotación humana para la precisión en la ética y el sesgo, junto con impactos regulatorios como la Ley de IA de la UE que favorecen a los proveedores premium. Las opiniones contrarias cuestionan si la madurez de los LLM reducirá la demanda de nuevos datos después de 2028.

Estas empresas están prosperando. Y parece que van a cambiar no solo cómo interactuamos con la IA, sino cómo trabajamos.

Hacia nuevos Modelos de Negocio y Empleos

La economía de la IA es un gigante, y ya está aquí, no se puede evitar. Nos guste o no, el futuro lo ejecutarán las máquinas, pero… la imaginación pertenecerá a los humanos. Los trabajos van a cambiar radicalmente en los próximos años. Y las habilidades técnicas que solían ser tan importantes en el pasado comenzarán a desvanecerse lentamente para dar paso a nuevas habilidades.

Si bien no estamos seguros de cómo será ese futuro, estamos seguros de una cosa: las habilidades más importantes serán aquellas que ayuden a los modelos de IA a mejorar sus puntos ciegos, no los clickbaits, los trabajos fáciles, sino aquellos que necesitan interpretación, aquellos que necesitan comprender la complejidad de la vida con una comprensión empática.

La empatía, como mencionó Philip K. Dick en su libro "¿Sueñan los androides con ovejas eléctricas?" (también conocida por su famosa película "Blade Runner"), es la última frontera humana, una de las comprensiones más complejas de la naturaleza y, por lo tanto, de la realidad.

Join the Conversation

We're just getting started on this journey. If you're interested in the intersection of human quality data and AI, we'd love to hear from you.

Kliver Team
Research & Strategy