Qué es PageRank – Patentes de Google

Para facilitar el entendimiento de la patente de Google, el PageRank y el peso de los enlaces, me gustaría hacer uso de una analogía. Esta nos ayudará a entender la primera patente de Google, la segunda patente y la forma en que se pasa el PageRank.

La red de carreteras presenta un modelo radial, con centro en Madrid, pero cuenta con unos ejes transversales como el Mediterráneo, el Ebro o el Andaluz. La red es mayor en las comunidades más dinámicas económicamente (Madrid, Cataluña, Comunidad Valenciana). Igual que en Google, existen puntos del país que son más importantes que otros, en los cuales se concentra mucho tráfico y que están muy bien enlazados hacia otras direcciones, otros puntos están enlazados solamente entre sí. Todos los puntos tienen una relevancia diferente pero todos están moviendo tráfico de un lugar a otro.

PageRank

Imaginemos ahora que Madrid, Barcelona y Valencia son 3 sitios Web. Considerando lo anterior, Madrid está enlazada desde puntos fuertes como Valencia o Barcelona (y cientos de ciudades y pueblos). Esto es un indicador de que Madrid seguramente es importante, pues le llega mucho tráfico desde ciudades con autoridad como Barcelona, Valencia, como también de otras más pequeñas (que a su vez están bien enlazadas con otras ciudades). Por lo cual, podríamos concluir que el PageRank de Madrid es muy alto.

Primera Patente de Google (Random Surfer Model)

Si Madrid tiene un PageRank alto, hay una alta probabilidad de que un conductor que conduce aleatoriamente su coche por España, acabe llegando a Madrid. Una vez ahí en Madrid, ¿qué hará un conductor que desea seguir conduciendo? Según la primera patente de Google, a este le da igual si continua por la A2 hacia Barcelona, o la A3 hacia Valencia, A4 hacia Sevilla o la A5 hacia Badajoz, ya que la probabilidad con la que el conductor escogerá una ruta hacia otras ciudades, es la misma. Sin hay 100 rutas en Madrid hacia otras ciudades, todas 100 heredarán el mismo porcentaje de PageRank proporcionalmente, es decir 1%.

Sin embargo, Google se ha dado cuenta de que esto no es verdad, pues el conductor no es un conductor que conduzca aleatoriamente (Random Surfer Model), sino que es un conductor racional (Reasonable Surfer Model).

Segunda Patente de Google (Reasonable Surfer Model)

La segunda patente de Google describe que el conductor que llegue a Madrid y que desea seguir conduciendo, no irá a Badajoz, si lo que le interesa realmente es ir a la playa, así que hará uso del enlace Madrid-Valencia y no del enlace Madrid-Badajoz. Google no sabe cuántos conductores elegirán a Madrid-Valencia o Madrid-Badajoz pero sí sabe que la probabilidad no es la misma para todos y que por este motivo no puede repartir el PageRank proporcionalmente como en la primera patente.

Para resolverlo, Google se ve obligado a hacer un pronóstico para la ruta por la cual se decantarán los conductores, basándose en su posición, su tamaño, su color y otros factores más que podéis encontrar en el artículo de Bill Slawski sobre el Reasonable Surfer. Supongamos que el pronóstico de Google después de analizar el sitio web Madrid, es el siguiente:

De todos los visitantes que lleguen a Madrid y deseen continuar conduciendo a otros sitios a través de las 5 rutas que ofrece Madrid, distribuiré el PageRank de la siguiente manera:

– Madrid-Barcelona 35%

– Madrid-Valencia 30%

– Madrid-Sevilla 24%

– Madrid-Badajoz 10%

– Madrid-Ciudad Real 1%

Menos el factor de amortiguación que está entre 0 y 1, respectivamente. Para Madrid-Ciudad Real sería casi 0% (Ahora imaginaros cuando hay más 100 enlaces en una sola URL).

Un aspecto importante de la segunda patente es que nos dice que un enlace pasa más o menos PageRank dependiendo de su uso, este valor podría estar entre 100% y 0% y puede variar. Esto según la  teoría, puesto que no sabemos si Google realmente hace uso de esta patente o no, ni tan sólo si la usa de esta forma, pero hacer uso de ella tendría mucho sentido, pues según la antigua patente, todas las rutas hubiesen heredado un 20% de PageRank, lo cual falsifica la realidad y al mismo tiempo permite la manipulación de los enlaces.

Manipulación del PageRank

Ahora imaginaros que en Ciudad Real no sólo se construyó un aeropuerto que nadie usa, si no que además se construyeron autovías directas hacia Barcelona, Sevilla, Badajoz, Albacete y Madrid pasando por Toledo. Al principio el sistema pensará que esta ciudad es importante por su red de carreteras y aumentaría su PageRank al nivel de Madrid, Barcelona o Valencia. Pero si por estas vías no circula ningún conductor y no generan tráfico, el sistema descubriría que es un intento de manipulación, así que tanto los enlaces hacía ese sitio como los enlaces desde ese sitio, no valen lo que aparentan ser.

Lo mismo pasaría si un sitio importante como Madrid posee vías donde nadie circula y que son deficitarias como las R-2, R-3, R-4 o AP-41, el sistema reconocerá que estas vías a estos sitios no valen lo que aparentan ser, pues nadie circula por ellas y por ello no son relevantes a pesar de los millones invertidos en ellas.

El éxito de Google durante los últimos años contra el Spam, es posiblemente un resultado de esta segunda patente. Google estaría en capacidad de saber que no todas las autovías tienen el mismo valor y que su valor depende de su uso. El tráfico que estas vías lleven a una ciudad, definirán su valor y viceversa. Igualmente, definirán la importancia del sitio al que estas conduzcan.

Google Chrome

Un paso más en esta dirección sería el uso de Google Chrome como lo comentó Hanns Kronneberg en su artículo. Con Google Chrome, Google no necesitaría un pronóstico, sino que estaría en capacidad de ver lo que realmente es y valorar bien qué uso tienen dichos enlaces. Este sería el tercer avance después de las 2 patentes anteriores.

Independientemente de si Google hace uso de los datos de Chrome o no, debemos saber que Google los posee, que nos lo ha comunicado y que puede hacer uso de ellos si así lo desea.

Según algunos SEOs que conzco, grandes portales como ElPaís.com o ElMundo.es no hacen uso de Google Analytics, muchos portales pequeños tampoco (por desconocimiento o porque no lo ven necesario), es decir, que Google no sabe qué pasa realmente en estos dominios, pero con Google Chrome, Google tendría acceso a todos estos datos de forma fiable.

En un gran artículo de Iñaki Huerta (que recomiendo leer), se cuestiona la legalidad de obtener los datos de Google Chrome, sin embargo, en Abril del 2014 Google reconoció leer los emails de Gmail de forma automatizada para ofrecer mejor su publicidad. Si Google lee algo que protegemos con contraseña, personalmente, no creo que Google tenga reparos en recoger datos de forma anónima.

Por último: No hay que olvidar que viajar desde las Islas Baleares o desde las Islas Canarias a Madrid, Barcelona o Valencia, quedará excluido en este modelo de carreteras/enlaces y no pasarán ni heredarán PageRank. Puesto que no hay carreteras a estas islas, los viajeros llegarán en avión o en Barco, es decir, tráfico directo generado por otro tipo de medios de transporte (Email, Adwords, Redes Sociales, etc). Incluso esto está considerado en la Segunda Patente de Google :)

Espero que os haya sido de utilidad y que os haya gustado!

Artículos relacionados