Un antiguo empleado de Yandex ha filtrado el código fuente del motor de búsqueda y otros servicios. Esto proporciona información interesante sobre el funcionamiento interno del motor de búsqueda: factores de posicionamiento, ponderaciones, etc.
Yandex es el motor de búsqueda líder del mercado en Rusia y ocupa el quinto lugar a nivel mundial en términos de páginas vistas. Aunque Yandex no es Google, el funcionamiento básico de los motores de búsqueda es comparable. Las siguientes conclusiones no son necesariamente aplicables de forma directa a Google, pero proporcionan una visión interesante:
El código fuente contiene una extensa lista de 1.922 factores de posicionamiento diferentes. Sin embargo, dado que 999 de estos factores de posicionamiento tienen la etiqueta TG_DEPRECATED, 242 tienen la etiqueta TG_UNUSED, 149 tienen la etiqueta TG_UNIMPLEMENTED y 115 tienen la etiqueta TG_REMOVED, nos quedarían 417 factores de posicionamiento activos, unos cuantos más de los aproximadamente 200 que Google ha asumido hasta ahora.
Como ya ha confirmado Google, Yandex también utiliza diferentes algoritmos y ponderaciones en función de la consulta de búsqueda. Por ejemplo, diferencia por hora del día: hay ponderaciones por la mañana y por la noche (IND_FI_MORNING_QUERY), pero por supuesto también hay diferencias para el contenido para adultos (IND_FI_XPORNO_QUERY), las consultas comerciales (IND_FI_QUERY_COMMERCIALITY_MX) y mucho más.
Una lista inicial de ponderaciones de los factores de posicionamiento (nav_linear.h), sugiere que las señales de posicionamiento más importantes para Yandex se encuentran en estas cuatro áreas:
- Enlaces: Al igual que Google, Yandex utiliza un algoritmo PageRank para evaluar la calidad de los enlaces. Los textos de los enlaces son importantes, al igual que su antigüedad.
- Señales de usuario: Google lo niega, pero en Yandex el código fuente muestra claramente que las señales de usuario son un factor de posicionamiento. Valores como el CTR, el tiempo en el sitio, la tasa de rebote y el número de visitantes que vuelven a los SERPs influyen en el posicionamiento en Yandex.
- Calificaciones de relevancia del contenido del texto: Por supuesto, también se incluye el clásico de los motores de búsqueda. Yandex utiliza principalmente BM25, un conocido método de recuperación de información. También se pueden encontrar otros clásicos, como por ejemplo comprobar si la palabra clave está contenida en la URL.
- Confianza y calidad: Para temas delicados como la salud y los contenidos financieros Yandex, al igual que Google, establece mayores requisitos de calidad. Por ejemplo, existen 7 factores de posicionamiento diferentes solo para temas médicos (FI_MEDICAL*).
Muchas de las suposiciones sobre los factores de posicionamiento de Google pueden encontrarse en el código fuente de Yandex. Esto no es una confirmación de que Google también los utilice, pero es un buen indicio. Por ejemplo, Yandex suele posicionar mejor los contenidos publicados en Wikipedia.org que otros contenidos. Los errores del servidor (códigos de estado 400/500) también tienen un efecto negativo en el posicionamiento. Al igual que ocurre con Google, Yandex también valora positivamente el cifrado HTTPS y la velocidad.
En definitiva, la filtración del código de Yandex ofrece una visión muy interesante del funcionamiento interno de un motor de búsqueda moderno. Aunque no todas las conclusiones pueden aplicarse directamente a Google, se confirman muchas de las hipótesis formuladas en los últimos años sobre el funcionamiento general de los grandes motores de búsqueda de Internet. Creo que la industria SEO tiene semanas interesantes por delante con nuevas perspectivas.