Blog técnico

¿Qué es el Data Mining?

Proceso a seguir en Data Mining

El Data Mining, también conocido como minería de datos, se encarga de descubrir patrones en un conjunto de datos. Para alcanzar este objetivo se aplican técnicas de aprendizaje automático y de inteligencia artificial. Una de las principales funcionalidades que se buscan en estas técnicas es conseguir tratar la información en bruto para dejarla preparada de forma que la información quede accesible y lista para ser utilizada por otros sistemas o para ser interpretada por usuarios finales.

¿Qué técnicas se usan en el Data Mining?

Entre las técnicas utilizadas nos encontramos con técnicas de clustering como puede ser:

  • K-means o K-NN
  • Reducción de variables mediante la técnica de PCA
  • Clasificación por parámetros mediante árboles de decisión
  • Detección de anomalías mediante herramientas matemáticas como t-statistics
  • etc.

Mediante clustering seremos capaces de agrupar los datos por características comunes, es decir, podremos generar tantos grupos como queramos. Los elementos que estén en un mismo grupo mostrarán características o patrones comunes.

Gracias a la reducción de variables podremos pasar de problemas complejos a nivel computacional a problemas computacionalmente resolubles. La idea de esta técnica es quedarse con las variables que realmente aporten información al conjunto de datos basándose en los conocimientos de álgebra lineal.

Los árboles de decisión son diagramas de construcciones lógicas, basados en reglas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva. De esta forma se puede clasificar el conjunto de datos estudiado.

Si bien es cierto que, aunque hemos nombrado estas técnicas, existen muchas otras que se aplican en este tipo de analítica avanzada de datos.

Proceso a seguir en Data Mining

Qué es el Data Mining

Para finalizar un proyecto de data mining con éxito, es recomendable seguir un guión.

Veamos un ejemplo de procedimiento:

  • Seleccionar el conjunto de datos: este conjunto de datos se debe seleccionar de acuerdo con el objetivo fijado y a las variables que tengamos disponibles.
  • Análisis del conjunto de datos: antes de comenzar, es importante saber a qué datos nos enfrentamos y cómo están distribuidos. Por ello, los histogramas y los valores anómalos serán un buen inicio para conocer nuestros datos.
  • Procesamiento de los datos: prepararemos los datos de forma que estos se adapten a las necesidades del algoritmo que se vaya a utilizar.
  • Aplicación del algoritmo de minería de datos: tras estudiar el problema, procederemos a aplicar la técnica que mejor se adapte a nuestro problema y a nuestros datos.
  • Obtención del conocimiento: tras la aplicación del algoritmo seleccionado, obtendremos el resultado. El resultado puede proceder de un algoritmo o de varios, según la complejidad del problema y de la complejidad que queremos dotar a la solución. Utilizar más o menos algoritmos no mejorará el resultado final. Para un resultado óptimo debemos escoger el conjunto de algoritmos que mejor se adapte tanto al problema como a los datos.
  • Evaluación del resultado final: tras obtener los modelos en el paso previo, tendremos que interpretar los resultados obtenidos. Es importante verificar la validez de los resultados finales. De este punto depende que todos los anteriores cobren sentido.

¿Para qué sirve el Data Mining?

Antes de comenzar el estudio de los datos, tenemos que fijar bien los objetivos que queremos alcanzar. Por eso, es importante saber qué podemos conseguir gracias a la minería de datos.

Por ejemplo, en una compañía de telefonía podemos, mediante un árbol de decisión, clasificar los clientes que se han ido de la empresa.

Si estamos ante una empresa que se dedica al suministro de energía, podremos realizar, en función del consumo, una clusterización de clientes para segmentarlos. Con ello, conseguiremos generar un prototipo de cliente y cuál es su segmento de consumo.

Gracias a estos dos ejemplos, podríamos enfocar nuestras campañas de marketing a un público muy concreto, fijándonos en qué grupo nos da más rentabilidad y por ello enfocando todos nuestros esfuerzos en un público muy concreto. Al conocer a nuestro público objetivo, conoceremos aproximadamente sus gustos y su forma de vida por lo que incidir en él será más sencillo mediante una buena estrategia de marketing.

COMPARTE ESTE POST

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email