Resumen
El presente Trabajo de Fin de Grado tiene por objeto el estudio del author profiling como disciplina dentro del procesamiento del lenguaje natural, con especial atención a su evolución reciente en el marco de las competencias PAN (Plagiarism Analysis, Authorship and Social Software Misuse), celebradas entre los años 2020 y 2024. El objetivo principal consiste en analizar de forma sistemática los enfoques metodológicos aplicados en dichas ediciones, identificando patrones tecnológicos, estrategias recurrentes y su rendimiento relativo en tareas de clasificación de autor, verificación de autoría, detección de cambios de estilo y análisis moral. La investigación se apoya en 40 trabajos seleccionados en función de su rendimiento técnico y relevancia documental. A partir de un proceso de revisión cualitativa y análisis comparativo, se realiza una clasificación de modelos en cuatro grandes categorías: enfoques tradicionales, redes neuronales clásicas, arquitecturas basadas en transformers y sistemas híbridos. El estudio revela la progresiva consolidación de modelos preentrenados de gran escala (LLMs) y la aplicación de técnicas de few-shot learning en entornos con recursos limitados.
El trabajo concluye con una reflexión crítica sobre los desafíos éticos asocia
dos al perfilado automatizado de autoría y propone una línea futura de investigación centrada en el análisis moral del discurso digital