Mejora de la interpretabilidad de mensajes de Twitter

Buades Pérez, Luis (2018). Mejora de la interpretabilidad de mensajes de Twitter. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.

Descripción

Título: Mejora de la interpretabilidad de mensajes de Twitter
Autor/es:
  • Buades Pérez, Luis
Director/es:
  • Ordieres-Meré, Joaquín
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: Febrero 2018
Materias:
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

La sociedad en la que vivimos cada vez esta más digitalizada. Ha llegado a tal extremo que a día de hoy, no se concibe un mundo sin la tecnología. Esta tecnología abarca desde máquinas robóticas hasta plataformas de microblogging como puede ser Twitter, en la que cada vez más personas expresan sus opiniones y sentimientos. Es por eso, que estas últimas, cada vez tienen una mayor relevancia tanto a nivel personal como empresarial. Tanto es así, que actualmente, tanto las grandes como las medianas y pequeñas empresas tienen una gran dependencia de las redes sociales, ya sea para promocionarse, para vender o para extraer información acerca de los gustos y opiniones de los usuarios. Este Trabajo Final de Grado se centra en el análisis e interpretación de los mensajes a través de la plataforma Twitter, tanto de los procedimientos ya existentes como en el diseño de una nueva propuesta aplicando distintas técnicas aprendidas, así como proponiendo una serie de mejoras complementarias (las cuales permitan mejorar el modelo) hasta ahora no desarrolladas, como son: Interpretación de imágenes Interpretación de mensajes irónicos Interpretación de mensajes en otro idioma cooficial del territorio español. A la hora de analizar un tweet de forma exhaustiva se deben seguir dos procedimientos, los cuales, a su vez están subdivididos en uno y dos subprocesos respectivamente: 1. Preproceso: a) Interpretabilidad de los mensajes 2. Análisis de sentimiento: a) Clasificación de los mensajes b) Carga emocional de los mensajes Para que sea más fácil su entendimiento, se considerarán a la par los tres procedimientos, los cuales se detallarían de forma breve y concisa (interpretabilidad, clasificación y carga emocional). Interpretabilidad de los mensajes Para poder clasificar y analizar un mensaje es esencial que este sea entendible y coherente, es decir, que sea interpretable. En numerosas ocasiones, los usuarios de las plataformas tipo Twitter expresan su opinión mediante expresiones gramaticalmente incorrectas, es por eso que surge este procedimiento, el cual consiste en la adaptación de las expresiones léxicas incorrectas del mensaje a unas normalizadas y por tanto entendibles. Las técnicas aquí utilizadas se basan especialmente en dos procesos secuenciales: 1. Diferenciación de la expresiones léxicas IV (In vocabulary, formas léxicas correctamente escritas) de las OOV (Out Of Vocabulary, expresiones léxicas mal escritas). 2. Corrección de las expresiones OOV. Clasificación de los mensajes Una vez corregido el mensaje y antes de pasar a analizar su carga emocional, este suele clasificarse en función de una categoría, ya bien sea porque solo interesa analizar esa, descartar alguna o simplemente por el hecho de realizar distintos análisis en función de su categoría. Las técnicas empleadas en este procedimiento se basan en un clasificador binario, cuya función es analizar si el mensaje pertenece a un tópico o por si al contrario, se debe descartar esa categoría. Carga emocional del mensaje La finalidad de este proceso es la de asignarle una carga emocional a cada mensaje en función del sentimiento que este transmite. A pesar de que muchas veces este análisis se diferencia en polaridad, intensidad y emoción, en este trabajo se ha decidido realizar un análisis combinado de estas técnicas al cual se le ha denominado simplemente como polaridad. Esta polaridad se determina en seis niveles: N: Polaridad negativa de baja intensidad N+: Polaridad negativa de alta intensidad P: Polaridad positiva de baja intensidad P+: Polaridad positiva de intensidad NEU: Polaridad neutra NONE: Ausencia de polaridad A la hora de analizar diferentes modelos que permitan obtener esta información de forma fiable se han analizado dos técnicas distintas: Aprendizaje automático: Sistema automático que busca entre los datos para detectar patrones, con la finalidad de ajustar las acciones de un programa establecido previamente. Enfoque basado en léxicos - Diccionarios: Sistema cuya finalidad es la de dotar a las expresiones de una polaridad previamente preestablecida comparándolas con un listado de términos.

Más información

ID de Registro: 50445
Identificador DC: http://oa.upm.es/50445/
Identificador OAI: oai:oa.upm.es:50445
Depositado por: Biblioteca ETSI Industriales
Depositado el: 24 Abr 2018 09:06
Ultima Modificación: 24 Abr 2018 09:06
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM