Blog técnico

ALL YOU NEED IS…. ANOMALY DETECTION.

¿NO VALE CON ALGORITMOS DE CLASIFICACIÓN?

Dentro de la gestión de datos para  análisis predictivos, la Detección de Anomalías se ha resuelto como uno de los enfoques más utilizados, por ser sencillo e intuitivo, a la par que efectivo.

Nació como un método válido para detectar intrusos en los sistemas informáticos y es ampliamente usado en campos tan diversos como el mantenimiento predictivo o la clasificación de correo como spam.

1

¿NO VALE CON ALGORITMOS DE CLASIFICACIÓN?

Antes de continuar, una pregunta: ¿no podríamos simplemente utilizar, por ejemplo, en el caso de mantenimiento preventivo, un algoritmo de clasificación que nos permita catalogar los eventos como «correcto» o «error»?

La respuesta no es fácil de afirmar o negar «a priori», pero es verdad que a pesar de las poderosas herramientas que son los algoritmos de clasificación, a la hora de categorizar eventos, estos modelos presentan ciertas limitaciones.

1º PROBLEMA: LA SOBRE-REPRESENTACIÓN

La primera de ellas, muy presente en la vida real, trata de la sobre-representación de una de las clases respecto a las otras.

Pensemos, por ejemplo, en un algoritmo destinado a predecir los fallos de cierta máquina industrial. Para poder hacerlo, y basándonos en el esquema de los algoritmos de clasificación de aprendizaje supervisado, necesitamos muestras pasadas de eventos categorizados como “ok” y eventos pasados categorizados como “fallo”, para alimentar a nuestro algoritmo y que pueda, con la experiencia, poder discernir satisfactoriamente entre “fallo” y “ok” para eventos futuros no clasificados todavía.

Si tenemos muchas más muestras del estado “ok” que del estado “fallo” (como es habitual), el algoritmo tenderá a ponderar la clase dominante, no produciendo resultados satisfactorios (el estado “fallo” es el que queremos predecir).

2º PROBLEMA: ¿CONOCEMOS TODOS LOS FALLOS POSIBLES?

Por otra parte, esta estructura de programación exige conocer todas las situaciones en las que aparece la clase “fallo”, siendo difícil predecir tal salida cuando no se haya producido tal fallo con anterioridad.

Así que, en líneas generales, los algoritmos de clasificación pueden tener un pobre rendimiento en estos escenarios.

¿QUÉ UTILIZAR ENTONCES?

Este tipo de problemas precisan de otro enfoque distinto: la Detección de Anomalías.

En la Detección de Anomalías, más conocida en su forma inglés, Anomaly Detection (todo en inglés suena mejor), se hace clara la idea de que para conocer cuando algo va mal, pueden darse dos enfoques: o conocer cuándo los parámetros indican que el evento de estudio va mal, o conocer cómo son los parámetros cuando el evento de estudio funciona bien.

La primera no es siempre accesible y de esta segunda forma, cuando los parámetros indiquen que el evento se sale de sus parámetros normales en condiciones óptimas, alertará, por tanto, de una anomalía.

Bastará, volviendo al caso de nuestra máquina industrial, con parametrizar los valores cuando ésta funcione correctamente y, estableciendo un rango adecuado móvil (que va aprendiendo con la experiencia), indicar una anomalía cuando estemos fuera de rango.

Dotar a este algoritmo con una nueva información, verificando la correcta clasificación de eventos, podrá aumentar su precisión (por ejemplo, ampliando su rango de definición de eventos correctos).

5

UN PASITO MÁS HACIA LA INDUSTRIA 4.0

Aunque con este enfoque conseguimos suplir la sobre-representación de la clase dominante (algo que otros algoritmos como el SMOTE podría suplir), el verdadero poder de la detección de anomalías estriba en el hecho de que podremos predecir anomalías…

¡¡¡aún cuando nunca hayamos visto una!!! 

Esto lo hace idóneo para tareas de predicción basadas en el deterioro y el desgaste, como en las tareas de mantenimiento.

6

Actualmente, las máquinas de todas las industrias están generando datos, no paran de hablar.

Poco a poco, aumentan las herramientas para poder “escucharlas” y dejarlas por ejemplo, que nos indiquen si están bien o están mal, si necesitan un mantenimiento y en qué.

El algoritmo de Detección de Anomalías es un apoyo más para avanzar en la gestión eficiente de recursos y datos, y permite a las empresas obtener esa ventaja competitiva en costes, teniendo un buen posicionamiento en uno de los campos que más en auge está (y estará, acorde a informes de Gartner o Forrester): el Internet of Things (IoT).

Las empresas tratan de embarcarse en esta nueva ola de tecnología que forman la Industria 4.0 y el aprovechamiento eficiente de los recursos, las cuales son claves para conseguirlo.

“No hay nada tan inútil como hacer con gran eficiencia algo, que no debería hacerse en absoluto”
Peter Drucker

COMPARTE ESTE POST

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email