Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google

Domínguez Puerto, Julio (2018). Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google
Author/s:
  • Domínguez Puerto, Julio
Contributor/s:
  • Mateos Caballero, Alfonso
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: June 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (646kB) | Preview

Abstract

En el año 1998 se publicaba el artículo “The PageRank Citation Ranking: Bringing Order to the Web” donde Larry Page y Sergey Brin sentaban las bases de lo que sería el buscador de Google: “La importancia de una página web es un problema inherentemente subjetivo que depende del interés de los lectores, de su conocimiento y de sus inclinaciones. Este artículo describe PageRank, un método para valorar las páginas web de forma objetiva y mecánica”. Las primeras versiones del algoritmo de Google se basaron en el PageRank que se centraba en calcular la importancia de cada web a partir de los vínculos entre ellas, es decir, los enlaces entre URLs que conforman internet. A lo largo de los años, han entrado en juego muchos más factores a la hora de ordenar los resultados de búsqueda a medida que Google ha sacado actualizaciones de su algoritmo. La tendencia actual se encuentra en darle relevancia a la experiencia del usuario, otorgándole importancia al contenido de calidad, a los sitios webs rápidos, a páginas adaptadas a dispositivos móviles, a entornos con estructuras claras, organizadas y definidas. Con el paso del tiempo, esta tendencia irá aumentando exponencialmente gracias a la ayuda del machine learning que permite cada día que pasa simular mejor el comportamiento de los usuarios. A pesar de esto, el PageRank sigue siendo un factor fundamental. La meta principal de Google es ofrecer el contenido que mejor responda a la intención de búsqueda de los usuarios, esto hace que cada día que pasa tengan más peso todos esos enlaces entre URLs que refuercen el contenido y resuelvan las necesidades. El presente proyecto tiene como principal objetivo analizar en profundidad el funcionamiento del PageRank, sumado a el desarrollo de un programa que tiene como meta calcular cómo se distribuye la autoridad interna en un sitio web seleccionado, dando soluciones de mejora reales sobre la página web.---ABSTRACT---In 1998, the paper "The PageRank Citation Ranking: Bringing Order to the Web" was published, in which Larry Page and Sergey Brin wrote the foundations for what would become Google's search engine: "The importance of a website is an inherently subjective problem that depends on the readers interest, knowledge and inclinations. This article describes PageRank, a method for evaluating web pages in an objective and mechanical way, effectively measuring the human attention and interest directed towards each page”. The first versions of Google's algorithm were based on PageRank, which focused on calculating the importance of each website from the links between them. Over the years, many more factors have come into play when it comes to sorting search results as Google has released updates to its algorithm. The trend is towards giving relevance to the user experience, giving importance to quality content, fast websites, pages adapted to mobile devices and, organized and defined structures. Soon this trend will increase exponentially with the help of machine learning. With these new factors, PageRank has lost the supremacy it had over the rest of the factors, but it is still a fundamental factor. Google's primary goal of delivering content that best matches to user's search intentions, means that every day that passes, all those links between URLs that reinforce the content and improve the user experience will have more weight. The main objective of this project is to analyze in depth the functioning of the PageRank and develop a program to calculate how the internal authority is distributed on a selected website, in order to provide solutions for improvement and better use of resources.

More information

Item ID: 53400
DC Identifier: http://oa.upm.es/53400/
OAI Identifier: oai:oa.upm.es:53400
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 21 Dec 2018 07:44
Last Modified: 21 Dec 2018 07:44
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM