<\/span><\/h2>\n\n\n\n
<\/p>\n\n\n<\/p>\n
El an\u00e1lisis de datos indica que los sectores en los que m\u00e1s incidencia tiene la tasa de abandono son Telecomunicaciones, Prensa y Energ\u00eda. Esto es debido principalmente a modelos de negocio basados en contratos temporales o de subscripci\u00f3n. Adem\u00e1s, se estima que el 68% de los clientes que cambian de empresa es porqu\u00e9 han recibido una atenci\u00f3n deficiente.<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
En la actualidad, gracias a los avances en computaci\u00f3n y el registro constante de miles de transacciones, la contenci\u00f3n de clientes es mucho m\u00e1s eficiente. De hecho, algunas investigaciones indican que un aumento de las tasas de retenci\u00f3n de clientes de apenas un 5% incrementa las ganancias entre un 25% y un 95%, y que las empresas en crecimiento priorizan el \u00e9xito del cliente m\u00e1s que aquellas que se encuentran estancadas.Debemos, en definitiva, utilizar la informaci\u00f3n que nos dan para reducir la tasa de abandono<\/strong>, conocida como churn<\/em>, identific\u00e1ndola primero, agrupando los clientes abandonistas seg\u00fan el perfil y entiendo las causas de este desapego para poder establecer unos protocolos de actuaci\u00f3n y evitar, as\u00ed, perder al cliente. <\/p>\n\n\n\n
<\/p>\n\n\n<\/p>\n
<\/span>Entonces, \u00bfc\u00f3mo retenemos a nuestros clientes?<\/strong><\/span><\/h2>\n\n\n\n
<\/p>\n\n\n<\/p>\n
La respuesta es mediante algoritmos predictivos de fuga de clientes. Para ello, trabajamos con la metodolog\u00eda CRISP-DM (Cross-Industry Standard Process for Data Mining) que mediante un proceso jer\u00e1rquico formado por varias tareas, ofrece a tu organizaci\u00f3n la estructura necesaria para obtener mejores y m\u00e1s r\u00e1pidos resultados en la miner\u00eda de datos.<\/p>\n
\n\n\n
<\/p>\n\n\n
\n
\n<\/p>\n
\nComprensi\u00f3n del negocio <\/li>\n Comprensi\u00f3n de los datos<\/li>\n Preparaci\u00f3n de los datos <\/li>\n Modelado<\/li>\n Evaluaci\u00f3n<\/li>\n Implantaci\u00f3n o despliegue<\/li>\n Visualizaci\u00f3n<\/li>\n<\/ol>\n\n<\/div>\n\n\n\n
\n<\/p>\n
<\/figure>\n\n<\/div>\n<\/div>\n\n\n
<\/p>\n\n
Para realizar todo este proceso, utilizamos la herramienta\u00a0KNIME<\/strong>\u00a0que ofrece el ciclo completo de Data Mining. Con la posibilidad de conectarse a m\u00faltiples y heterog\u00e9neas fuentes de datos podremos unificar datos provenientes de distintas BBDD, archivos y servicios web diversos como Azure, etc. con muy poco esfuerzo.<\/p>\n\u00a0<\/p>\n\n
<\/p>\n\n\n<\/p>\n
Con una gran variedad de nodos para el preprocesamiento la herramienta ofrece las condiciones \u00f3ptimas para la generaci\u00f3n de procesos de ETL automatizada. Finalmente ofrece los principales algoritmos y m\u00e9todos de evaluaci\u00f3n para la generaci\u00f3n de modelos potentes. Adicionalmente dispone de m\u00faltiples extensiones (Text Processing, Big Data con Spark y Hadoop, Deep Learning con TensorFlow y Keras y muchas m\u00e1s) que empoderan la herramienta a\u00fan m\u00e1s.<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n <\/figure>\n\n\n\n
<\/p>\n\n\n<\/p>\n
En definitiva, mediante KNIME<\/strong> podemos realizar todos los procesos divididos en los siete puntos que nos marca la metodolog\u00eda CRISP-DM que veremos a continuaci\u00f3n a trav\u00e9s de un proyecto real:<\/p>\n\n\n\n
<\/p>\n\n\n<\/p>\n
<\/span>Comprensi\u00f3n del negocio<\/strong><\/span><\/h2>\n\n\n\n
<\/p>\n\n\n<\/p>\n
El cometido general de esta fase es entender los objetivos y requerimientos del proyecto desde una perspectiva de negocio y convertir este conocimiento en la definici\u00f3n de un problema de miner\u00eda de datos y un plan preliminar para alcanzar los objetivos. <\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
Partimos de una compa\u00f1\u00eda del Sector de las Telecomunicaciones. Con una tipolog\u00eda de contrato para sus clientes que no exige permanencia. Por otro lado, la fluctuaci\u00f3n de clientes es muy fuerte, con muchas entradas y salidas todos los meses. El objetivo de este proyecto es la retenci\u00f3n de clientes mediante algoritmos predictivos de fuga de clientes.<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
<\/span>Comprensi\u00f3n de los datos<\/strong><\/span><\/h2>\n\n\n\n
<\/p>\n\n\n<\/p>\n
En esta fase el objetivo principal es poder hacer una captura inicial de los datos a analizar para familiarizarse con ellos, identificar problemas de calidad en los mismos, detectar subconjuntos de los datos que pudieran ser interesantes para formular hip\u00f3tesis espec\u00edficas que validar posteriormente con el an\u00e1lisis, e incluso identificar las primeras claves del conocimiento que se puede extraer de los datos.<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
Para este caso, los datos disponibles son los siguientes:<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
\nDatos personales con fuga marcada (Sistema ERP)<\/li>\n Datos de contrataci\u00f3n (Sistema ERP)<\/li>\n Datos de uso (Sistema Monitorizaci\u00f3n de uso)<\/li>\n Datos de facturaci\u00f3n (Sistema Facturaci\u00f3n)<\/li>\n<\/ul>\n\n\n\n
<\/p>\n\n\n<\/p>\n
<\/span>Preparaci\u00f3n de los datos<\/strong><\/span><\/h2>\n\n\n\n
<\/p>\n\n\n<\/p>\n
Una vez seleccionados los datos, se pasa a la fase de la preparaci\u00f3n de datos. La preparaci\u00f3n de datos, a menudo llamada \u00abpreprocesamiento\u00bb, es la etapa en la que los datos en bruto se limpian y organizan para la siguiente fase del procesamiento. Durante la preparaci\u00f3n, los datos en bruto se verifican para detectar errores. El objetivo de este paso es eliminar los datos err\u00f3neos (datos redundantes, incompletos o incorrectos) y empezar a crear datos de calidad.<\/p>\n
\n\n\n
<\/p>\n\n\n<\/p>\n
Para la preparaci\u00f3n, KNIME<\/strong> permite la integraci\u00f3n de m\u00faltiples fuentes de datos (BBDD SQL, Excel, CSV, Webservices\/APIs)<\/p>\n\n\n\n
<\/p>\n\n\n<\/p>\n