Detección de temas de discusión y difusión de opiniones en comunidades online

Bermejo Hernández, Carmen (2020). Detección de temas de discusión y difusión de opiniones en comunidades online. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Detección de temas de discusión y difusión de opiniones en comunidades online
Author/s:
  • Bermejo Hernández, Carmen
Contributor/s:
  • Corcho García, Óscar
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: October 2020
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

El objetivo de este trabajo es proveer de una herramienta para poder entender mejor la difusión de ideas, argumentos y opiniones en comunidades online. Para ello he desarrollado una aplicación web que permite identificar los temas de debate dentro de una comunidad online y, dentro de esos debates, identificar los distintos argumentos y opiniones que los usuarios publican sobre un tema. Este trabajo sienta las bases para, en un desarrollo futuro, poder estudiar como se propagan las ideas dentro de las comunidades online con el objetivo de entender mejor estas dinámicas. La comunidad online elegida para este trabajo ha sido Menéame, una plataforma web tipo foro donde los usuarios comparten noticias de actualidad que otros usuarios comentan, generando hilos de debate. Los datos analizados corresponden al contenido publicado por los usuarios en esta plataforma durante el primer semestre de 2020, que cubre la duración del primer estado de alarma en España debido a la pandemia de COVID-19. Por medio de la aplicación se han importado las noticias y comentarios generando una estructura de hilos que asocia cada noticia con sus comentarios. A continuación se han agrupado las noticias por medio del algoritmo de clústering AffinityPropagation de Sckit-learn. Con una búsqueda por palabras clave dentro de los clusters se han identificado aquellos relacionados con una temática escogida como ejemplo: la renta básica. Se ha comprobado la eficacia del clasificador para identificar esta temática utilizando una muestra de 100 ejemplos (50 noticias de los clusters etiquetados como renta básica y 50 noticias al azar) anotada por tres personas con una puntuación de inter-annotator agreement de 0,91, obteniendo una exahustividad del 100% y una precisión del 77%. Para identificar los distintos argumentos e ideas expresadas dentro de los debates sobre renta básica en la plataforma se ha hecho un nuevo clústering a partir de todos los documentos (noticias y comentarios) pertenecientes a los hilos de esta temática. Queda como desarrollo futuro seguir trabajando en la clasificación de argumentos. La plataforma cuenta con información sobre qué usuarios han publicado cada mensaje y en qué momento por lo que, una vez etiquetados los argumentos, se puede extrapolar mucha información sobre la difusión de ideas entre los usuarios y a lo largo del tiempo en la plataforma, así como la influencia que la exposición a distintas ideas tiene en los usuarios, teniendo también en cuenta el punto de partida de los mismos, según las ideas que expresan. Este trabajo incluye también un pequeño estado del arte de los métodos, modelos y métricas del análisis de influencia, con el fin de sentar las bases para una investigación más amplia que permitirá identificar las mejores herramientas para poder entender las dinámicas de difusión de ideas y consolidación de opiniones dentro de una comunidad.---ABSTRACT---The goal of this proyect is to provide a tool to improve the understanding of opinion dinamics and idea flows in online comunities. For this I’ve developed a web aplication that helps to identify topics of debate inside an online community and the different arguments and opinions published by users in the context of this debates. This work sets the fundations that will allow, in future develpments, to understand better how ideas and opinions spread within this communities. The case of study chosen is Menéame, a Spanish platform, similar to Reddit and very popular in Spain and Latin America. In this platform, users share news that other users comment, creating discussion threads. The data analized is the content published by users in the platform during the first semester of 2020, that includes the first state of alarm in Spain during the COVID-19 pandemic. The news and comments has been imported to our web aplication, generating threads that link each news with its comments. Then the news has been clustered using the AffinityPropagation algorithm, implemented by Sckit-learn. Using a key word search inside the clusters, I have identify the threads that fit the topic chosen to test the application: the basic income. The eficiency of the classifier has been tested using an anotated sample with 100 instances (50 chosen among the news inside the clusters tagged as Basic Income and 50 randomly chosen among all the news). This sample has been annotated by 3 anotators, obtaining an inter-annotator agreement of 0,91, a recall of 100% and a 77% precission. To identify the arguments and ideas shared inside the debates about basic income in the platform, a new clustering has been made, using all the documents (news and comments) inside the threads tagged with this topic. It is left for future develpoment to continue working along these lines to improve arguments classification. The aplication has information about what users has published each message and when so, once it’s been tagged, we can infer a lot of information about idea flow among the users and across time in the platform, along with the influence that idea exposition has in the users, taking also into account their starting point, acording to the ideas they share. This work also includes a small state of the art of methods, models and metrics of influence analysis, intending to set the ground work for a broader investigation in the future, that will allow to identify the best tools to understand the dynamics of idea flows and how opinions take root inside online comunities.

More information

Item ID: 65226
DC Identifier: http://oa.upm.es/65226/
OAI Identifier: oai:oa.upm.es:65226
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 04 Nov 2020 13:17
Last Modified: 04 Nov 2020 13:17
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM