Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google

Domínguez Puerto, Julio (2018). Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Modelos y algoritmos del PageRank y su importancia en el funcionamiento de Google
Author/s:
  • Domínguez Puerto, Julio
Contributor/s:
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: June 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFG_JULIO_DOMINGUEZ_PUERTO.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (646kB) | Preview

Abstract

En el año 1998 se publicaba el
artículo “The PageRank Citation Ranking: Bringing
Order to the Web” donde Larry Page y Sergey Brin sentaban las bases de lo que sería el
buscador de Google:
“La importancia de una página web es un problema inherentemente subjetivo que
depende del interés
de los lectores, de su conocimiento y de sus inclinaciones. Este
artículo describe PageRank, un método para valorar las páginas web de forma objetiva y
mecánica”.
Las primeras versiones del algoritmo de Google se basaron en el PageRank que se
centraba en calcular la importancia de cada web a partir de los vínculos entre ellas, es
decir, los enlaces entre URLs que conforman internet.
A lo largo de los años,
han entrado en juego muchos más factores a la hora de
ordenar los resultados de búsqueda a medida que
Google ha sacado actualizaciones de
su algoritmo. La tendencia
actual
se encuentra en darle relevancia a la experiencia del
usuario, otorgándole importancia al contenido de calidad, a los sitios webs rápidos, a
páginas adaptadas a dispositivos móviles, a entornos con estructuras claras, organizadas
y definidas. Con el paso del tiempo,
esta tendencia irá aumentando exponencialmente
gracias a la ayuda del
machine learning
que permite cada día que pasa simular mejor el
comportamiento de los usuarios.
A pesar de esto, el
PageRank sigue siendo un factor fundamental. La meta principal
de Google
es
ofrecer el contenido que mejor responda a la intención de búsqueda de los
usuarios, esto
hace que cada día que pasa tengan más peso
todos esos enlaces entre
URLs que refuercen el contenido y
resuelvan las necesidades.
El presente proyecto tiene como principal objetivo analizar en profundidad el
funcionamiento del PageRank,
sumado a
el desarrollo de un programa
que tiene como
meta
calcular cómo se distribuye la autoridad interna en un sitio web seleccionado,
dando
soluciones de mejora
reales sobre la página web.---ABSTRACT---In 1998, the paper "The PageRank Citation Ranking: Bringing Order to the Web"
was published, in which Larry Page and Sergey Brin wrote the foundations for what
would become Google's search engine:
"The importance of a website is an inherently subjective problem that depends on
the readers interest, knowledge and inclinations. This article describes PageRank, a
method for evaluating web pages in an objective and mechanical way, effectively
measuring the human attention and interest directed towards each page”.
The first versions of Google's algorithm were based on PageRank, which focused on
calculating the importance of each website from the links between them.
Over the years, many more factors have come into play when it comes to sorting
search results as Google has released updates to its algorithm. The trend is towards
giving relevance to the user experience, giving importance to quality content, fast
websites, pages adapted to mobile devices and, organized and defined structures.
Soon
this trend will increase exponentially with the help of machine learning.
With these new factors, PageRank has lost the supremacy it had over the rest of the
factors, but it is still a fundamental factor. Google's primary goal of delivering content
that best matches to user's
search intentions,
means that every day that passes, all those
links between URLs that reinforce the content and improve the user experience will
have more weight.
The main objective of this project is to
analyze
in depth the functioning of the
PageRank and
develop
a program
to calculate how the internal authority is distributed
on a selected website, in order to provide solutions for improvement and better use of
resources.

More information

Item ID: 53400
DC Identifier: https://oa.upm.es/53400/
OAI Identifier: oai:oa.upm.es:53400
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 21 Dec 2018 07:44
Last Modified: 21 Dec 2018 07:44
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM