Mejora de la interpretabilidad de mensajes de Twitter

Buades Pérez, Luis (2018). Mejora de la interpretabilidad de mensajes de Twitter. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.

Description

Title: Mejora de la interpretabilidad de mensajes de Twitter
Author/s:
  • Buades Pérez, Luis
Contributor/s:
  • Ordieres-Meré, Joaquín
Item Type: Final Project
Degree: Grado en Ingeniería en Tecnologías Industriales
Date: February 2018
Subjects:
Faculty: E.T.S.I. Industriales (UPM)
Department: Ingeniería de Organización, Administración de Empresas y Estadística
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

La sociedad en la que vivimos cada vez esta más digitalizada. Ha llegado a tal extremo que a día de hoy, no se concibe un mundo sin la tecnología. Esta tecnología abarca desde máquinas robóticas hasta plataformas de microblogging como puede ser Twitter, en la que cada vez más personas expresan sus opiniones y sentimientos. Es por eso, que estas últimas, cada vez tienen una mayor relevancia tanto a nivel personal como empresarial. Tanto es así, que actualmente, tanto las grandes como las medianas y pequeñas empresas tienen una gran dependencia de las redes sociales, ya sea para promocionarse, para vender o para extraer información acerca de los gustos y opiniones de los usuarios. Este Trabajo Final de Grado se centra en el análisis e interpretación de los mensajes a través de la plataforma Twitter, tanto de los procedimientos ya existentes como en el diseño de una nueva propuesta aplicando distintas técnicas aprendidas, así como proponiendo una serie de mejoras complementarias (las cuales permitan mejorar el modelo) hasta ahora no desarrolladas, como son: Interpretación de imágenes Interpretación de mensajes irónicos Interpretación de mensajes en otro idioma cooficial del territorio español. A la hora de analizar un tweet de forma exhaustiva se deben seguir dos procedimientos, los cuales, a su vez están subdivididos en uno y dos subprocesos respectivamente: 1. Preproceso: a) Interpretabilidad de los mensajes 2. Análisis de sentimiento: a) Clasificación de los mensajes b) Carga emocional de los mensajes Para que sea más fácil su entendimiento, se considerarán a la par los tres procedimientos, los cuales se detallarían de forma breve y concisa (interpretabilidad, clasificación y carga emocional). Interpretabilidad de los mensajes Para poder clasificar y analizar un mensaje es esencial que este sea entendible y coherente, es decir, que sea interpretable. En numerosas ocasiones, los usuarios de las plataformas tipo Twitter expresan su opinión mediante expresiones gramaticalmente incorrectas, es por eso que surge este procedimiento, el cual consiste en la adaptación de las expresiones léxicas incorrectas del mensaje a unas normalizadas y por tanto entendibles. Las técnicas aquí utilizadas se basan especialmente en dos procesos secuenciales: 1. Diferenciación de la expresiones léxicas IV (In vocabulary, formas léxicas correctamente escritas) de las OOV (Out Of Vocabulary, expresiones léxicas mal escritas). 2. Corrección de las expresiones OOV. Clasificación de los mensajes Una vez corregido el mensaje y antes de pasar a analizar su carga emocional, este suele clasificarse en función de una categoría, ya bien sea porque solo interesa analizar esa, descartar alguna o simplemente por el hecho de realizar distintos análisis en función de su categoría. Las técnicas empleadas en este procedimiento se basan en un clasificador binario, cuya función es analizar si el mensaje pertenece a un tópico o por si al contrario, se debe descartar esa categoría. Carga emocional del mensaje La finalidad de este proceso es la de asignarle una carga emocional a cada mensaje en función del sentimiento que este transmite. A pesar de que muchas veces este análisis se diferencia en polaridad, intensidad y emoción, en este trabajo se ha decidido realizar un análisis combinado de estas técnicas al cual se le ha denominado simplemente como polaridad. Esta polaridad se determina en seis niveles: N: Polaridad negativa de baja intensidad N+: Polaridad negativa de alta intensidad P: Polaridad positiva de baja intensidad P+: Polaridad positiva de intensidad NEU: Polaridad neutra NONE: Ausencia de polaridad A la hora de analizar diferentes modelos que permitan obtener esta información de forma fiable se han analizado dos técnicas distintas: Aprendizaje automático: Sistema automático que busca entre los datos para detectar patrones, con la finalidad de ajustar las acciones de un programa establecido previamente. Enfoque basado en léxicos - Diccionarios: Sistema cuya finalidad es la de dotar a las expresiones de una polaridad previamente preestablecida comparándolas con un listado de términos.

More information

Item ID: 50445
DC Identifier: http://oa.upm.es/50445/
OAI Identifier: oai:oa.upm.es:50445
Deposited by: Biblioteca ETSI Industriales
Deposited on: 24 Apr 2018 09:06
Last Modified: 24 Apr 2018 09:06
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM