Blog técnico

¿Qué predicciones obtenemos al utilizar algoritmos de Machine Learning?

Machine Learning(3/3) - Resultados de la Predicción

Machine Learning(3/3) – Resultados de la Predicción

Tras el primer post de introducción a los algoritmos de Machine Learning y siguiendo el segundo dónde se trataba el estudio de la serie temporal y el algoritmo que se ha decidido utilizar, llega el último post de esta serie.

Se comenzará con una gráfica que refresque la memoria sobre cuáles eran los datos de los que se disponía, a continuación, se pasará a ver la predicción realizada por R y por último se representará de forma gráfica mediante una herramienta de B.I los consumos reales y las predicciones realizas, así como el error cometido por las predicciones frente a los consumos reales.

¿Por qué es importante predecir?

Como se describió en el anterior post, es importante reconocer las futuras ventas para así poder gestionar los recursos dentro de la organización, reduciendo los costes operativos.

Los datos sobre los que se realizará la predicción, tal y como se observa en la siguiente imagen,corresponden a las ventas desde Junio 2014 a Enero 2017.

consumos

Se ha realizado una predicción de 10 meses, entre Febrero y Noviembre.

Se dispone de los datos de los meses entre Febrero y Noviembre para realizar la comparación entre la predicción y las ventas reales.

Predicciones usando el Algoritmo Arima en RStudio

Tras aplicar el algoritmo Arima, obtenemos en R los siguientes resultados:

resultados R

Representados de forma gráfica en R, se obtiene lo siguiente:

resultados representados R

La línea gris representa el consumo real en el pasado. La línea azul marca la predicción realizada y las zonas sombreadas, la azul representa el intervalo de confianza del 80% mientras que en la zona sombreada gris se representa el intervalo de confianza del 95%.

El intervalo de confianza es cuanto puede diferir la realidad frente a la predicción de modo que, por ejemplo, en el caso del intervalo del 95%, representa un intervalo en el que hay una posibilidad del 95% de que el consumo en ese mes se mantenga dentro de dicho intervalo.

A priori, se puede ver que en agosto del 2017 las ventas van a caer de forma significativa, mientras que los meses más cercanos va a haber una gran venta de este producto. Esto no es para nada descabellado, si nos fijamos en los años anteriores se observa que todos los meses de agosto el consumo es muy bajo y en los meses colindantes el consumo es muy elevado. También podemos observar que en marzo va a haber una caída en los consumos, que se corresponde con el resto de los años, pues se puede observar una caída acusada en el tercer mes de todos los años.

Ciertamente, extraer algunas conclusiones sobre la predicción a priori está bien, pero, sería mucho mejor si pudiésemos contrastar la predicción con los consumos reales y comprobar cuán buenos son los resultados obtenidos. A continuación, se muestra la gráfica que representa este escenario:

resultados representados qlik

En azul tenemos los consumos anteriores. En rojo tenemos los consumos reales entre los meses de Febrero y Octubre del 2017 y, por último, con barras amarillas representamos las predicciones realizadas por Arima.

Como podemos observar nuestra predicción se adecua de una manera muy precisa a los datos reales de ventas.

Calidad de la predicción

Para medir cuán bueno es una predicción frente a los resultados reales se utiliza la siguiente fórmula, que recibe el nombre de Error Medio de Porcentaje (EMP):

formula 1

donde CR es el consumo real y  PC es la predicción de consumos realizada.

Del mismo modo, se puede calcular el Error Absoluto Medio de Porcentaje (EAMP) mediante la siguiente fórmula:

formula 2

En este caso, EMP = -5.30%  y EAMP=5.30% . Por consiguiente, estamos ante una predicción muy precisa.

Objetivos alcanzados con el uso de Algoritmos de Machine Learning

De esta forma, se concluye con esta serie de post, cuyos objetivos eran:

1.- Conocer los algoritmos de Machine Learning.

2.- Elegir el algoritmo adecuado para nuestros datos y nuestros objetivos.

3.- Realizar la predicción de forma adecuada.

4.- Obtención y representación de forma gráfica de los resultados.

Que se pueden predecir las ventas de una referencia y de este modo ajustar los recursos de una empresa en función de las necesidades que puedan surgir derivadas de poder adelantarse al futuro y tener una predicción que es capaz de representar de una forma muy precisa la realidad.

COMPARTE ESTE POST