¿Por qué estoy obteniendo diferentes valores para las páginas indexadas en la búsqueda de Google, el GSC y SISTRIX?

A menudo puede suceder que los datos que obtengas de Google site:-query, la Google Search Console (GSC) y la herramienta SISTRIX Toolbox no coincidan.

No podrás comparar directamente los datos obtenidos de un site:-query en Google y la Google Search Console, ya que son calculados de forma separada por Google. Es por eso que obtendrás diferentes resultados los cuales fueron publicados en tiempos diferentes.

Comparando las páginas indexadas: Google site:-query y los datos de SISTRIX

Google site:-query for the domain zalando.de on March 28th, 2016

Google site:-query para el dominio zalando.de el 28 de marzo de 2016

SISTRIX data for the domain zalando.de. Last data point from March 28th, 2016

datos de SISTRIX para el dominio zalando.de. Último punto de datos 28 de marzo de 2016

Cuando estás evaluando dos conjuntos de datos, siempre deberías tomar en consideración la fecha en que la información fue medida. En el ejemplo anterior, los datos de Google site:-query son ligeramente más recientes.

El número de páginas indexadas en SISTRIX Toolbox son un promedio

De acuerdo a las declaraciones de Google, el número de páginas indexadas se vuelve una estimación aproximada tras más de 1.000 páginas (ten cuenta la palabra “aproximadamente” al lado izquierdo de los resultados). Con el fin de eliminar los valores atípicos más grandes, recolectamos los datos de SITRIX varias veces por semana y luego calculamos el valor en promedio. Para ello, utilizamos site:-query en Google, lo que asegura que nuestros valores vienen directamente de Google. Calculamos el promedio sobre los datos de una semana. Si mostramos que las páginas indexadas han subido (o bajado), entonces estos son los números que obtenemos directamente de Google al momento de realizar el site:-query. De igual manera, solo agregamos un nuevo punto de datos al historial cuando nos damos cuenta de un cambio en el numero de páginas en promedio.

Los valores que varían fuertemente deberían ser examinados

Si el número de tus páginas varía notablemente, deberías observar la causa de esto. En muchos casos, contenido duplicado o contenido que Google evalúa como menos importantes son la causa. Primero, Google indexará estas páginas (el número de páginas indexadas aumentará) y luego el filtro otra vez sacará los duplicados y páginas menos importantes (el número de páginas indexadas disminuirá). Esto también aplica a las versiones imprimibles de las páginas, Identificación de Sesiones, Enlaces de Afiliados y otros.

Ejemplo utilizando red-simon.com

Para darte un ejemplo, observemos el site:-query para el dominio red-simon.com en 2013. Vamos a los resultados que están atrás (página de resultados 10 en nuestro ejemplo), podemos ver la razón para un incremento notable en el número de páginas indexadas.

Google site:-query for red-simon.com in 2013

Google site:-query para red-simon.com in 2013

Con red-simon.com podemos ver que hay bastantes URLs dinámicas (con bastantes parámetros) los cuales pueden ser encontrados en los resultados de búsqueda (por ejemplo red-simon.com/data/cmsv2.asp?mid=41&sid=1&pid=533).

Estas piezas de contenido probablemente pueden ser accedidas a través de un número de diferentes URLs y por lo tanto son duplicadas. Hasta cierto punto, estas páginas también eran redirigidas utilizando la redirección 302, la cual Google no entiende. Siempre utiliza una redirección 301 para tus redirecciones.

Seguramente sería bueno para la página web eliminar las URLs dinámicas y reemplazarlas con URLs dinámicas, mod_rewrite podría ser una de las soluciones para este ejemplo.