Big Data: de los datos a la información
Datos: origen y destino
No hay ninguna duda en que los datos son una enorme fuente de progreso y riqueza, muchos dicen ya que son el nuevo petróleo, el diamante del siglo XXI. Pero por sí solos no valen de nada, hay que pulirlos, refinarlos, para convertirlos en materia útil y valiosa. Porque aunque, a priori, muchas veces los usemos como sinónimos, datos e información no son lo mismo.
Los datos representan un hecho o circunstancia concreta, exenta, sin vinculación con otros acontecimientos, que se describe y representa únicamente a sí mismo. Sin embargo, la información es el resultado de la puesta en relación de un conjunto de datos, y esa es la clave, la interconexión de ítems, que procesados ofrecen una descripción de un contexto entendible, que facilita la toma de decisiones bajo la filosofía data driven. Como vemos, la información se nutre de datos para conformarse, pero estos han de ser compilados, cribados, relacionados y tratados para conseguir la utilidad que la caracteriza y diferencia de los registros aislados. El viaje del primer término, de la fuente, al resultado final se realiza gracias al Big Data, que no es más que la capacidad de analizar grandes volúmenes de datos, de tratar con datos masivos, para conformar información valiosa en cualquier entorno, especialmente en el empresarial, donde hay mucho dinero en juego.
Datos: origen y destino
Hablamos de ingentes cantidades de datos y, seguramente nos quedamos cortos al intentar hacernos a la idea de lo que esto significa. El progreso y abaratamiento de la computación ha provocado una ilimitada expansión de los dispositivos electrónicos y las actividades que desarrollamos con ellos, lo que unido a la universalización, celeridad y alta capacidad de las telecomunicaciones, ha dado como resultado la generación de millones y millones de input por segundo.
Hoy en día todas las acciones que llevamos a cabo, no solo en ambientes profesionales, sino en las rutinas más cotidianas, tienen un alto componente digital del que, quizá, ni nos damos cuenta: pagamos con tarjeta, mandamos correos electrónicos, nos guiamos con GPS, utilizamos redes sociales, compramos on line, llevamos un móvil siempre con nosotros…
En consecuencia, el volumen de datos disponibles ha crecido, y lo seguirá haciendo, exponencialmente, y partimos ya de volúmenes altamente llamativos. Un contador de actividad en la red nos indica que, durante un minuto, se publican más de 500.000 tweets, y se realizan más de 4 millones de búsquedas en Google. Si lo multiplicamos por los 60 minutos que tiene una hora o los 525.600 con los que cuenta un año, el resultado es inabarcable. Y esto son solamente ejemplos básicos y anecdóticos.
Como vemos, hoy en día, casi cualquier actividad deja su huella, emite datos que pueden ser estructurados, con formato y tamaño predefinidos, como los ERP (Enterprise Resource Planning) o CRM (Customer Relationship Management), o no estructurados, aquellos que no tienen un formato específico, tales como e-mails, sensores, imágenes, pdf, contenido de los social media… En este punto volvamos a la clasificación ya mencionada, puesto que todos estos registros necesitan ser compilados, tratados y almacenados, es decir, seguir procesos ETL (Extract, Transformation and Load), para su conversión en información visual e intuitiva, que nos ayude en las más diversas actividades: sanidad, cultura, ocio, ciencia… pero, sobre todo, en la empresa ámbito en el que nos estamos centrando.
Para llevar a cabo este proceso, conocidas las fuentes de datos, es obvio que se requiere de herramientas analíticas para su procesamiento y de profesionales, científicos de datos, que hagan su magia de cara a conseguir ese ansiado producto final: la información. Aunque la principal exigencia para conseguir resultados verdaderamente transformadores no es externa, si no interna, un cambio de visión, un giro hacia la filosofía data driven, que promueva la transformación digital en el conjunto de la empresa.
Beneficios de la Analítica de Datos
Bajo este prisma de trabajo, con la ciencia de datos como eje central, los beneficios son innumerables. Pasamos de contar con registros desechados, o que ni si quiera se sabía que existían, a transformarlos en material altamente valioso para la gestión empresarial. Si además al tratamiento de estos datos le sumamos Inteligencia Artificial y Business Intelligence sus potencialidades son aún mucho mayores. Del resultado de esta simbiosis nacen, por ejemplo, los sistemas de predicción de la demanda, que dan un paso más proyectando la información a futuro, ya que facilitan predicciones de ventas a X tiempo vista, simplificando la toma de decisiones en los departamentos de compras, gestión de almacenes, logística… mejorando el conjunto de la cadena de suministro.
Fijémonos en los siguientes modelos. ¿Qué nos aporta la enumeración de datos de la primera imagen? ¿Qué podemos ver en la segunda?
La primera es mucho más complicada a la hora de sacar conclusiones tal y como la vemos en este momento. La segunda, sin embargo, nos facilita un visionado sencillo e intuitivo de la realidad de nuestras ventas, los históricos de las mismas y la predicción de salida de referencias, lo que, insistimos, simplifica la compleja toma de decisiones. De un solo vistazo podemos comprobar cuáles son los artículos con mayor venta y su distribución por meses, información en base a la que la que se optimizan los procesos de gestión de stock, adecuándolos a las verdaderas necesidades de la empresa, evitando roturas y sobrealmacenajes.
Conclusión
La diferencia entre datos e información se basa en la interrelación y la utilidad. La explotación, a través de la analítica avanzada, de la ingente cantidad de datos que generamos en la actualidad, nos permite transformarlos en información que, trasladada a cuadros de mando, simplifican cualquier actividad empresarial. Con solo un vistazo al dasboard correspondiente podemos anticiparnos a un fallo en una línea de producción, diseñar rutas de transporte, optimizar la producción, gestionar almacenes, materializar compras… y un largo etcétera, haciendo las operativas más sencillas y eficaces, con los consiguiente ahorros de tiempo y dinero. Además, la aplicación de inteligencia artificial nos permite no quedarnos en el pasado, sino mirar hacia el futuro para anticiparnos a lo que sucederá, lo que hace que la toma de decisiones, apoyada en datos (filosofía data driven), sea sencilla y acertada.