¿Qué es el BIG Data?
Big Data es un término relativamente nuevo en el mundo empresarial. Este post pretende arrojar un poco de luz para saber un poco de qué es de lo que hablamos cuando decimos Big Data.
Como podemos deducir de su traducción, el Big Data no es más que un conjunto de tecnologías y herramientas que permiten trabajar con datos masivos. Definiciones formales de Big Data hay muchísimas, pero nosotros vamos a mencionar una de las primeras: la formulada por Gartner en torno al 2001 y que en la actualidad sigue siendo de referencia: “Big Data son datos que contienen una mayor variedad y que se presentan en volúmenes crecientes y a una velocidad superior”.
Así pues, Big Data surgió para dar respuesta a una realidad que antes no existía: cómo almacenar y procesar volúmenes de datos desmedidos, crecientes y que se generan a velocidades enormes.
Las 5 Vs del Big Data
La definición de Gartner nos habla de las características intrínsecas que diferencian los entornos Big Data: Volumen, Velocidad y Variedad. Son las denominadas 3 Vs del Big Data.
- Volumen: en Big Data hablamos siempre de grandes conjuntos de datos. Big Data significa literalmente “datos masivos” por lo que podemos decir que el volumen es la característica más asociada al Big Data.
- Velocidad: estos datos se generan a velocidades de vértigo y los sistemas deben registrarlos rápidamente para no producir cuellos de botella. Asimismo, en ocasiones es necesario procesarlos en tiempo real para una toma de decisiones efectiva.
- Variedad: los datos con los que trabaja pueden ser datos estructurados, como por ejemplo los almacenados en sistemas de bases de datos; o datos no estructurados, entre los que se incluyen documentos de texto, correos electrónicos, audios, vídeos, imágenes, datos de sensores, etc. La mayor parte de los datos que se generan actualmente son no estructurados, lo que añade una importante dificultad a la hora de gestionarlos y extraer información de ellos.
Si bien la definición de Gartner hace referencia a las 3 características fundamentales de todo ecosistema Big Data, en los últimos tiempos se ha quedado un poco corta y se han añadido dos características importantes a tener en cuenta: la veracidad y el valor.
- Veracidad: Con volúmenes enormes de datos provenientes de múltiples y variadas fuentes y que se reciben a velocidades altísimas, tenemos razones más que fundadas para cuestionar la veracidad que poseen los datos que se reciben. Esto supone un gran reto para las organizaciones pues es fundamental asegurar que la información que se recibe sea veraz. Es habitual recibir datos incorrectos o incompletos que, dependiendo del dato que se trate, pueden causar daño a la hora de realizar los análisis pertinentes. No obstante, una limpieza de los datos exhaustiva puede ser costosísima, por lo que es vital analizar correctamente qué datos limpiar.
- Valor: Este aspecto, en nuestra opinión, es uno de los más importantes de lo que entendemos por un sistema Big Data. Si los datos, una vez tratados y convertidos en información, no ofrecen valor para la organización, no habremos conseguido nada. Es decir, es fundamental que los sistemas de Big Data se construyan con el objetivo de aportar valor a la organización, generando información que permita agilizar y dirigir la toma de decisiones, la mejora de la gestión interna, la definición de nuevas estrategias optimizadas y, en definitiva, dándoles a las organizaciones la oportunidad de sacarle el máximo partido.
El Big Data del siglo XXI
Ha sido a partir del año 2005 aproximadamente cuando los sistemas Big Data han despegado definitivamente, impulsados fundamentalmente por dos hechos: primero la enorme cantidad de datos generada por los usuarios de redes sociales y servicios online que precisaba procesarse, y segundo por el desarrollo de las tecnologías Hadoop (y a partir de 2014 Apache Spark) que permitían un abaratamiento en el uso y el almacenamiento de los datos.
Desde entonces, el volumen de datos generado por los usuarios se ha disparado, creciendo exponencialmente. Además, ya no son solo los humanos los que generan datos, sino que los dispositivos electrónicos conectados a Internet (Internet de las cosas o IoT) y el machine learning están generando aún más y más datos.
Hoy en día, se aplican técnicas de Big Data para resolver problemas tan dispares como la creación y desarrollo de nuevos productos, análisis de la experiencia del cliente, la eficiencia operativa de las organizaciones o el mantenimiento predictivo de cadenas de producción.
COMPARTE ESTE POST
Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email