Hasta la aparición de las redes sociales era difícil recoger de manera industrial la información sobre los gustos, preferencias y creencias de los consumidores. Las empresas podían únicamente aplicar modelos estadísticos sobre las características descriptivas y estructuradas de personas (edad, direcciones, diplomas, categorías profesionales, etc.), pero después de la aparición de nuevas aplicaciones y las redes sociales, las empresas pueden colectar data estructurada y no estructurada (gustos, estados emocionales, desplazamientos, videos, imágenes, etc.) que permiten, por ejemplo, determinar los grupos de pertenencia socioeconómicos de los consumidores. Estos grupos de pertenencia determinan las necesidades más íntimas de personas y por lo tanto los medios de satisfacerles.

Las empresas que llegan a construir un conocimiento intimo de las necesidades de sus clientes aumentan su capacidad de fidelizarlos y adaptarse a sus expectativas actuales y futuras. Los datos se convierten de esta manera en centro de las reflexiones estratégicas.

Una metáfora largamente discutida es el trato de los datos como “materia prima”, carburante de una nueva economía. Más precisamente, la analogía se concentra mayoritariamente sobre el petróleo, motor del crecimiento del siglo pasado. Por oposición, el siglo XXI se presenta como el de la revolución digital y la economía de los datos. El modelo económico descrito reposa sobre una idea similar, la de un modelo extractivo de un recurso valorizable, raro, que permite alimentar el conjunto de nuestras actividades.

Es una analogía sobre la que probablemente ha oído o leído múltiples veces: los datos son el nuevo petróleo.

Es cierto que en varios aspectos la analogía encaja, ya que es fácil de establecer paralelos debido a la manera que la información (data) es usada para alimentar muchas de las tecnologías transformativas que vemos hoy en día, tales como la inteligencia artificial, la automatización y analítica predictiva avanzada.

El concepto es usualmente acreditado a Clive Humby (matemático británico), que resaltó el hecho de que, aunque inherentemente valioso, los datos necesitan procesamiento de la misma manera que el petróleo necesita refinación antes de que su verdadero valor sea expuesto y aprovechado.

Las analogías son importantes porque nos permiten que ideas complejas tengan sentido, pero son aún más útiles si examinamos diferencias y no solamente similitudes, y una de las más distinguidas es que los datos no son un recurso finito, ni disminuye su valor con su uso.

Comparar los datos con el petróleo implica también que puede ser pensado como mercancía (commodity). Pero a diferencia de muchos “commodities” los datos tienen un aspecto humano. Dicen algo acerca de los individuos y acerca de sus comunidades.

El petróleo crudo requiere refinación, siendo el equivalente en lo digital, que la data es el petróleo y la inteligencia artificial la refinería. Recientemente, un estudio emitido por IDC (International Data Corporation por sus siglas en inglés) estima que la utilización real de los datos una vez procesados e inyectados para alimentar los algoritmos de inteligencia artificial están en el orden solamente del 1% de los datos generados. El equivalente en el mundo petrolero sería el Factor de Recobro (porcentaje de crudo que se puede extraer de un pozo respecto a lo que tiene el yacimiento). Así que, desde el punto de vista del aprovechamiento de la monstruosa cantidad de datos generados, todavía hay mucho camino por recorrer.

Hay muchas lecciones que aprender de la industria petrolera y una de las principales es la de los efectos negativos desde el punto de vista ambiental (derrames, fracking, etc.), por lo que es perentorio informarse y estar alertas acerca de los impactos negativos de la data, tales como el riesgo de fugas de datos privados y el potencial de los algoritmos de automatizar injusticias. La comunidad digital debería tomar las lecciones aprendidas de cómo la legislación abordó las consecuencias negativas del uso del petróleo.

Se han sugerido analogías diferentes, y la del agua se está usando mucho y es muy común utilizar los términos “lagos de datos” (data lakes) o “diluvio de datos” (data deluge). Otras analogías como sangre, ríos, carreteras e incluso electricidad han sido sugeridas.

Todas estas analogías son útiles, pero muestran diferentes aspectos del problema. Probablemente debamos convivir con múltiples analogías y usarlas de manera muy cuidadosa para la situación especifica que se va a explicar. Comparar data con petróleo podría conllevarnos a pensar en las externalidades negativas de los datos, mientras que los ríos nos podrían ayudar a reconocer los derechos compartidos de los cuales nos beneficiamos por el uso de este recurso. Las carreteras podrían tal vez ayudarnos a recordar que los sistemas de datos tienen que ser mantenidos tan cuidadosamente como las vías en las cuales manejamos, para que sean de beneficio público.

https://fablabs.io/labs/artelaservzla


El periodismo independiente necesita del apoyo de sus lectores para continuar y garantizar que las noticias incómodas que no quieren que leas, sigan estando a tu alcance. ¡Hoy, con tu apoyo, seguiremos trabajando arduamente por un periodismo libre de censuras!