We stand with Ukraine

La inteligencia semántica demuestra su fiabilidad para detectar tendencias relacionadas con el Brexit

11 julio 2016

Expert System Iberia, en colaboración con el departamento de ciencias de la computación de la Universidad de Aberdeen, elaboró un informe sobre las tendencias más destacadas del Brexit en Twitter. El análisis de más de 55.000 tweets realizado durante las semanas previas al referéndum detectó la inclinación de los británicos por el Brexit, cuando la sensación general, a partir de muchas encuestas y opiniones de analistas, era que ganaría el Bremain. Para la realización del proyecto Expert System aportó la tecnología de análisis de contenido, Cogito Studio, y un equipo de investigadores procedentes de Madrid, Barcelona y Módena (Italia), liderados por José Manuel Gómez, responsable del área de I+D de Expert System Iberia.

El análisis contemplaba, entre otras variables, la intención de voto que mostraban los usuarios a partir de los tweets publicados. En los días previos al referéndum los datos recogidos por Expert System demostraron una tendencia que se confirmó el día 23 de junio en las urnas. En este sentido, un 77% de los tweets ingleses y galeses mostraban preferencia por irse de la Unión Europea (“leave”), siendo este porcentaje menor entre los norirlandeses, 65%, y especialmente, entre los escoceses, 58%. Los datos analizados mostraban la tendencia hacia el Brexit que luego se constató en el referéndum, ya que un 53.4% de los ingleses y un 52.5% de galeses votaron a favor de salir de la UE, mientras que el porcentaje fue inferior entre norirlandeses (44.2%) y escoceses (38%). Además de la intención de voto, el informe también analizó los temas más discutidos por los usuarios británicos en Twitter, que arrojaron diferencias significativas en función de la nación de procedencia.

Una de las principales conclusiones del trabajo realizado es que la tecnología semántica ha demostrado su utilidad para detectar tendencias, en este caso sobre la intención de voto de los usuarios de Twitter del Reino Unido, y que las conclusiones obtenidas han resultado más fiables que muchas de las encuestas tradicionales, a pesar de no partir de una muestra representativa. El gran valor que aporta esta tecnología, por encima de enfoques puramente estadísticos, es que permite obtener conclusiones fiables independientemente de que la muestra analizada sea pequeña o esté viciada en un sentido u otro. El trabajo realizado se centró en Twitter al tratarse de una herramienta especialmente adecuada como barómetro de opinión política, más si cabe cuando el análisis se centra en campañas electorales con temas muy polarizados y mensajes enmarcados en clave emocional, como en el caso del Brexit/Bremain.

José Manuel Gómez, responsable de I+D en Expert System Iberia, considera que “la geolocalización de los tweets analizados ha sido uno de los aspectos clave para entender los buenos resultados del informe, ya que nos ha permitido encontrar diferencias importantes de las emociones y opiniones en los distintos países del Reino Unido”. Gómez apunta que, “Twitter es un buen escenario para captar emociones, si bien tiene una cierta complejidad de análisis debido a las características propias de la Red Social que está muy condicionada por la limitación de caracteres”. Asimismo, las líneas de trabajo desarrollados por los investigadores de nuestra compañía se han centrado especialmente en afinar la formulación de hipótesis, ya que de su acierto depende  que puedan ser refrendadas con datos fiables, así como en poder limpiar la muestra  analizada del ruido y de las intoxicaciones que se producen habitualmente en Twitter.

Por lo que respecta al futuro, el responsable del área de I+D de nuestra compañía considera que, “todavía existe mucho camino por recorrer y que se está trabajando en varias líneas para mejorar la metodología de análisis que nos permitirá extraer resultados cada vez más fiables y detallados”. Actualmente, se están realizando grandes esfuerzos para garantizar la limpieza del ecosistema de análisis, para dejar al margen el ruido y los tweets viciados. Otra de las líneas en la que se está investigando es en el desarrollo de una biblioteca lo más amplia posible basada en emoticonos, que permitirán generar y clasificar un corpus muy amplio de tweets en función de las emociones mostradas por los usuarios. Esta segmentación facilitará y agilizará la clasificación de todos los tweets, independientemente de que cuenten con referencias gráficas a los estados de ánimo.

Por último, uno de los grandes retos en futuras investigaciones es el de abrir el análisis a  un mayor número de fuentes, como pueden ser otras redes sociales, las opiniones en medios de comunicación e incluso, analizar formatos audiovisuales de televisión o vídeo. El poder cruzar un mayor número de datos de fuentes muy diversas permitirá extraer resultados mucho más detallados, romper con barreras de segmentación y, en definitiva, obtener tendencias más cercanas todavía a la realidad que después se refleja en unas urnas.