Obtención y agregación de datos de portales de empleo en un sistema distribuido

Faya Fernández, Sergio (2021). Obtención y agregación de datos de portales de empleo en un sistema distribuido. Tesis (Master), E.T.S.I. de Sistemas Informáticos (UPM).

Descripción

Título:	Obtención y agregación de datos de portales de empleo en un sistema distribuido
Autor/es:	Faya Fernández, Sergio
Director/es:	Muñoz Fernández, Isabel https://orcid.org/0000-0002-2847-3059 Arévalo Viñuales, Sergio https://orcid.org/0000-0002-0807-0631
Tipo de Documento:	Tesis (Master)
Título del máster:	Software de Sistemas Distribuidos y Empotrados
Fecha:	Junio 2021
Materias:	Informática
ODS:	08. Trabajo decente y crecimiento económico
Palabras Clave Informales:	Sistemas distribuidos; Procesamiento de datos
Escuela:	E.T.S.I. de Sistemas Informáticos (UPM)
Departamento:	Sistemas Informáticos
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TESIS_MASTER_SERGIO_FAYA_FERNANDEZ.pdf]

PDF (Portable Document Format) - Acceso permitido solamente a usuarios en el campus de la UPM - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB)

Resumen

Actualmente, la utilización de portales online para la búsqueda de empleo está a la orden del día. Éstos tienen gran cantidad de ofertas y permiten a los usuarios realizar una consulta para poder encontrar el que mejor se ajusta a sus preferencias. Pero, que haya numerosos portales, cada uno con sus múltiples
ofertas, en ocasiones, lejos de facilitar la búsqueda, la hace aún más complicada. En la industria de las tecnologías de la información, esta tarea se complica debido a los nuevos sectores en crecimiento y a la gran cantidad de empleo dentro
de este sector. Como solución a este problema, proponemos la creación de un sistema de agregación de ofertas de empleo que permita al usuario buscar en los datos de varios portales a la vez. Haremos uso de Apache Kafka como pieza central, una
tecnología vista en el transcurso del máster que puede servirnos tanto como bróker de mensajería, como para el procesamiento y almacenamiento de grandes cantidades de información por segundo. También queremos demostrar los beneficios de una arquitectura de microservicios la cual nos aporta las propiedades de escalabilidad y flexibilidad, tanto en el desarrollo, como en el ciclo de vida de la aplicación. Para esto, hemos creado diferentes servicios cada uno con responsabilidades específicas dentro de nuestra solución, que son capaces de operar en conjunto, incluso estando implementados con diferentes lenguajes y tecnologías, gracias a la comunicación que pueden establecer entre sí. Estos microservicios son los siguientes: Fetchers: encargados de extraer ofertas de los portales de empleo; Processors: procesan las ofertas de los portales de empleo y las almacenan para que los usuarios puedan realizar búsquedas desde la web.; Proxy: encargado de redirigir las búsquedas de la aplicación web a los
processors; Aplicación web: página web donde los usuarios podrán realizar búsquedas de empleo. El sistema comienza su ejecución con la extracción de datos de empleo de los
portales LandingJobs y GraphQL Jobs. Los datos, tras su procesamiento, estarán disponibles para su consulta por parte del usuario. Además, las ofertas se actualizan cada X minutos (de manera configurable) para que el usuario tenga la
información reciente de forma transparente al portal de empleo.
Abstract:
Nowadays, the usage of job searching webpages is becoming more and more popular. These pages can keep a humongous amount of job offers and allow their users to query that information to find the most suitable job. The fact that there are many portals, each of them with lots of offers, can sometimes be more of a liability when querying. In the IT industry, this task gets more complex due to the increasing fields of work and the amount of job offers in our sector. As a solution to this problem, we are proposing the creation of a data aggregation system for job offers which allows end users to search in the offers of different places at the same time. We will make use of Apache Kafka as a core piece; this is a technology studied during the master’s degree which can be used both as a message broker and as data processing and storage for big data. We also want to prove the benefits of a microservice architecture which
involves the properties of scalability and flexibility during both the development process and the application lifecycle. For this reason, we have implemented different services each with specific responsibilities on our software solution that can work together being technology and language agnostic thanks to the communication among themselves. Fetchers: in charge of data ingestion from the job offer webpages; Processors: process the incoming job offers to later store them so that the user can query them from the web app; Proxy: in charge of redirecting the requests from the web app to the processors and filtering their results; Web App: website where the users will be able to query job offers. The flow of the system begins with the extraction of the job-offers data from the LandingJobs and GraphQL Jobs sources. The data, after being processed, will
be ready to be queried by the user. Also, the offers get updated every given minutes, based on a configurable value, in order to serve the latest information about job offers to the user.

Más información

ID de Registro:	68434
Identificador DC:	https://oa.upm.es/68434/
Identificador OAI:	oai:oa.upm.es:68434
Depositado por:	Biblioteca Universitaria Campus Sur
Depositado el:	07 Sep 2021 13:29
Ultima Modificación:	07 Sep 2021 13:29

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Obtención y agregación de datos de portales de empleo en un sistema distribuido

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional