Natzir Turrado es Consultor SEO

Natzir Turrado

  • Sobre Mi
  • Artículos
    • SEO (Posicionamiento en Buscadores)
    • CRO (Conversión Web)
    • Analítica Web
  • Mi Curso SEO
  • LinkedIn
  • RSS
  • Twitter

647 50 39 47

hola@natzir.com

Estás aquí: Portada > SEO (Posicionamiento en Buscadores) > Cómo funciona el PageRank y su implementación en Python

Cómo funciona el PageRank y su implementación en Python

8 septiembre, 2011 por Natzir Turrado

Ya sabemos que los enlaces de una página A hacia otra B pasan PageRank pero, ¿y de una página A hacia a la misma A? En este artículo veremos qué es el PageRank, otros algoritmos para calcular la autoridad de una página y cómo podemos calcular el PageRank en Python. De esta forma descubriremos qué ocurre si una página se enlaza a sí misma.

Tabla de contenidos

Qué es el PageRank

El PageRank es la forma que tiene Google de decidir la importancia de una página. Está considerado uno de los factores más importantes que determina el ranking de una página en los resultados de búsqueda junto con el contenido y RankBrain. Lo  comentan en el minuto 30:20 de este vídeo:

El PR es un valor numérico que representa la importancia de una página en la web. Cuando una página enlaza hacia otra, estaría emitiendo un voto hacia ella.

como-funciona-pagerank

Patente US6285999B1 – Method for node ranking in a linked database

Es por ello que cuantos más votos se tenga una página, más importante debe de ser y los votos que emita valdrán más.

Google no usa la fórmula original del PageRank desde 2006

El algoritmo original del PageRank ya no es el mismo y Google no usa esta fórmula desde 2006 como han confirmado.

pagerank-formula

Fórmula original del PageRank

Además, según sus patentes, la autoridad de una página se podría calcular de muchas otras formas a parte del PR. Por ejemplo, mediante Hilltop Algorithmm, Hyperlink-Induced Topic Search (HITS), Trust Rank, Topic-sensitive Page Rank, Resonable Surfer Model, Weighted PR, Entity Salience y otros algoritmos que no sepamos. Y, como comentan en Mariani, M. S. et al. Ranking nodes in growing networks: When PageRank fails, que el PageRank sea estático (que no tenga en cuenta el tiempo que lleva un enlace) hace que falle en ocasiones para determinar el ranking de las mejores página. Esto es algo que probablemente Google haya tenido en cuenta ya por la compra de dominios expirados para redirigir. Minuto 29:00 del siguiente vídeo:

Lo que no ha cambiado en todo este tiempo es que para calcularse se tienen en cuenta el número de enlaces salientes (sean o no hacia la propia página). Lo podemos ver en la variable C de la fórmula anterior (está en el divisor del sumatorio).

Implementación del PageRank en Python

Para poder calcular el PageRank, haremos uso de del algoritmo del PageRank implementado en Python. Utilizaremos la librería Fast PageRank que he dejado lista para funcionar en Google Colab (puedes acceder al notebook aquí).

Hagamos el siguiente ejercicio para ver cómo fluye el PageRank en diferentes casos. Tendremos en cuenta un damping factor (d en la ecuación anterior) del 85% que Google aplica para que el PageRank no tienda al infinito.

1. Una página enlaza a otra

  • PR A = 0,35
  • PR B = 0,65

2. Páginas enlazadas entre sí

  • PR A = 0,5
  • PR B = 0,5

3. Página que enlaza a otras dos

  • PR A = 0,26
  • PR B = 0,37
  • PR C = 0,37

4. Página que enlaza a otra y a sí misma

Podemos ver por fin el motivo de este artículo:

  • PR A = 0,5
  • PR B = 0,5

Vemos como efectivamente pasa PR enlazarse a sí mismo. Podéis comparar con el primer grafo para ver cuanto le suma a la página A.

5. Página que enlaza a otras dos y a sí misma

  • PR A = 0,33
  • PR B = 0,33
  • PR C = 0,33

Ahora añadimos un enlace interno D hacia A:

  • PR A = 0,36
  • PR B = 0,24
  • PR C = 0,24
  • PR D = 0,17

Gracias al enlace recíproco de A, esa página todavía gana más fuerza. Si quitásemos el enlace autorreferencial quedaría:

  • PR A = 0,28
  • PR B = 0,27
  • PR C = 0,27
  • PR D = 0,15

Y ahora hacemos que B y C devuelvan el enlace a A:

  • PR A = 0,56
  • PR B = 0,19
  • PR C = 0,19
  • PR D = 0,03

Conclusión

Hemos podido comprobar que, según la fórmula original del PageRank, los enlaces autorreferenciales pasan peso o «link juice».

Es algo que tendría sentido en función de la manera con la que quieras potenciar las páginas de tu web (PageRank sculpting).

Comentarios en "Cómo funciona el PageRank y su implementación en Python"

  1. Adrian Coutin dice

    4 noviembre, 2013 at 14:04

    Hola Natzir,

    Gracias x tu blog.

    Estoy revisando este tema a raiz de todos los cambios introducidos por penguin.

    Tengo un conjunto de páginas que tienen enlaces hacia si mismas, más por programación que cualquier objetivo de optimización, y están muy castigadas en el SERP.

    Creo que Penguin… como que no le mola el tema, pero en fin.. esto es en una una web tiene serios problemas de estructura. Pueden existir otroa factores..

    ciao !!

    Responder
  2. Lili dice

    16 diciembre, 2015 at 23:13

    Realmente en cuestiones de SEO lo mejor es ¨hacerle caso a google¨, ya demostraron que arrasaron en cuanto al spam y los métodos oscuros. El SEO actual es mucho sentido común, eso de enlazar a la misma página no tiene sentido alguno ni para el usuario ni para el webmaster. Debe de seguro existir un filtro para eso ajeno a la formula. Hay ingenieros de google cuyo trabajo es colarse en cuanto blog oscuro conozcan y derrumbar todo aquello que no tiene sentido o que no ayuda a las búsquedas de manera orgánica y natural. No pierdan el tiempo con eso, la dictadura del buscador es para largo…

    Lili

    Responder

Dejar un comentario en "Cómo funciona el PageRank y su implementación en Python" Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.