Blog técnico

Analizamos Twitter. Todas las reacciones del Real Madrid-Atlético

TECNICAS DE TEXT MINING PARA ANALIZAR TWITTER

TECNICAS DE TEXT MINING PARA ANALIZAR TWITTER

Hoy traemos al blog un artículo diferente. Y es que, utilizando como hacemos diferentes herramientas analíticas, como KNIME, podemos no solo explorar los datos internos de nuestras compañías, sino también mirar al exterior.

Twitter es un gran recurso si queremos conocer a nuestro entorno. Opiniones, críticas viscerales, halagos (de vez en cuando), … todo ello se concentra en Twitter. Así que, aprovechando que KNIME permite de forma sencilla conectarse a Twitter, decidimos hacer un rápido ejemplo.

EL DERBI A TRAVÉS DE TWITTER

Lo primero que tenemos que crear, es una API de Twitter. Hay varios sitios donde lo explican (por ejemplo, aquí  https://www.uno-de-piera.com/crear-una-aplicacion-para-twitter/). Con la API de Twitter obtendremos una serie de claves y token, que tendremos que copiar en el nodo de conector de KNIME.

el nodo de twitter bueno

Una vez conectados, empezamos nuestro proceso de extracción y tratamiento de información. Además de las herramientas de minería de texto que KNIME posee, diseñamos aquellas soluciones que necesitamos para el tratamiento ad hoc a nuestro caso de estudio (teniendo en cuenta que muchas de las herramientas de minería de texto están muy bien implementadas para el idioma inglés, siendo de menos utilidad para el castellano).

workflow

Como Twitter es muy grande, decidimos basarnos en la lista de Trending Topic para analizar bajo qué hashtag podemos tener más mensajes para analizar. Es por ello que usamos el #Megaderbichampions para nuestro análisis.

Gracias a distintas herramientas de minería de texto, podemos ir tratando nuestros tweets, teniendo siempre como objetivo final la creación de un Tag Cloud: una nube de palabras clavecon las que poder extraer información acerca de nuestro caso de estudio, en este caso, el derbi.

nube de palabras real madrid

Hemos polarizado distintas palabras para una mejor comprensión. A la luz de estos resultados, está claro que el Real Madrid fue el único equipo del partido. Y en concreto, Cristiano Ronaldo, que fue muy comentado en los tweets (sin duda, fue el protagonista del encuentro).

Debido a la variabilidad que puede tener analizar simplemente los tweets, el Tag Cloud nos sirve de guía para hacer una profundización en la información, y tratar de encontrar motivos. Por ejemplo, el hecho de que este fuera el hashtag utilizado por el canal Mega de Atresmedia, crea un sesgo hacia los comentaristas del mismo (en este caso, la etiqueta “petón” nos indica a José Antonio Martín Otín “Petón”, conocido periodista y fan rojiblanco.)

Dos nombres nos resultan curiosos en esta nube: “Messi” y “Benzema”.

¿JUGABAN MESSI Y BENZEMA?

A partir de los datos de Twitter, decidimos investigar ambos conceptos.

Los tweets que enlazaban con Messi, al contrario de lo que podíamos suponer al principio (la eterna comparación de quién de los dos es mejor), fueron principalmente tweets de burla, que enlazaban el hecho de que el Barcelona estuviese eliminado de la Champions, y que Messi enseñara su camiseta en el último clásico:

lo de messi

En cuanto a Benzema, decidimos seguir el rastro de los tweets, y descubrimos algo curioso.

nube de palabras benzema

Algunas críticas de los seguidores y el bajo rendimiento del jugador en el partido de ayer, hicieron que varios se planteasen las comparaciones con otros delanteros, ¿podría haber jugado Morata?

NECESIDAD DEL ANALISTA PARA UN CONOCIMIENTO MAYOR

Esto ha sido un pequeño ejemplo, hecho de una manera ágil sobre el partido de ayer. KNIME nos permite llevar a cabo este proceso de minería de texto sobre grandes volúmenes de datos. Podríamos ampliar las capturas, las fuentes de datos, incluso añadir nuevas plataformas de social media. Pero aun con todo, es necesario la supervisión y el “olfato” de un analista, que permita ver dónde flaquea el análisis, dónde indagar más y cómo enriquecer el tratamiento de la información.

COMPARTE ESTE POST