Jardinería como modelo de éxito SEO

Juan Gonzalez
I studied Regional Studies of Latin American at the University of Cologne - Germany, majoring in "Business Informatics“. I also studied Business Administration and currently I’m doing a Master in International Business Administration. I feel a fascination with SEO and the people who make it possible.
14. junio 2015 9 Comentarios
Jardinería como modelo de éxito SEO

Jardinería como modelo de éxito SEO

Durante las navidades y los veranos uno de los temas por obligación en la mesa con una parte de mi familia (que son agricultores), son los árboles frutales. Si algo he aprendido es que los árboles frutales se deben podar para que crezcan saludables, para sacarles más provecho, para que sean más “guapos“ y sobre todo, para que dé más frutos. Igualmente, los sitios Web se tienen que podar para que su tallo crezca con más fuerza y dé mejores frutos (modelo SEO de Zalando), de no hacerlo, obtendremos resultados adversos (modelo SEO de Zara). Cualquier URL que no proporcione información con un valor añadido, debería ser podada para que Google concentre su fuerza en el tallo del sitio Web y este crezca saludable y de frutos. ¿Cómo se hace, cuál es el mejor método y por qué es tan importante? Lo comentaré en este artículo.

Comprobando el estado de salud a través de la comparación directa

Comparemos primero el estado de salud de zalando.es y zara.com (de kiabi.es también). Introduzcamos en el campo de búsqueda de la herramienta los tres dominios separados por una coma y sin espacios (zalando.es,zara.com,kiabi.es). Obtendremos una comparación directa de algunas de las KPIs más importantes de los todos los módulos de la herramienta (SEO, Social, SEM, Universal y Links). Nosotros nos limitaremos al módulo SEO.

Comparar Dominios

Comparar Dominios

Fijemonos en el número de páginas indexadas por Google, en el número de palabra claves que han generado estos contenidos, y sobre todo en lo más importante, el número de palabras clave posicionadas en el top-10. A pesar de que zara.com tiene 10 veces más contenido que zalando.es y 5 veces más kiabi.es, estos 2 dominios superan claramente a zara.com en calidad (y zalando.es  lo ha logrado en mucho menos tiempo). Por esa razón encontramos con mucha más probabilidad a Zalando y a Kiabi en Google que a Zara. Es evidente que zara.com tiene que podar su dominio para mejorar. Pero antes de continuar explicaré porqué varían el número de páginas indexadas en GWMT, en Google, y SISTRIX.

Número de páginas Indexadas en GWMT, Google y SISTRIX

En muchos casos los valores de GWMT (Google Web Master Tools), de Google (cuando se usa el operador de búsqueda “site:“) y de SISTRIX no coinciden. De entrada, los datos de GWMT y los obtenidos a través de Google, no son comparables per se, ya que los datos de GWMT están sometidos a otro tipo de cálculo y por ello se obtienen resultados diferentes, que además, son publicados en espacios de tiempo diferentes. Según Google, para los dominios con más de 1.000 páginas, se presenta un cálculo estimado, así que hay que subrayar la palabra “Aproximadamente“ en los resultados de búsqueda.

Para ofrecer una solución a este dilema, recopilamos datos a diario de cada dominio haciendo uso del operador “site:“ y después calculamos en SISTRIX el promedio semanal de las páginas indexadas, es decir, los datos los obtenemos directamente de Google. Ahora veamos el promedio de páginas indexadas de los dominios zalando.es y zara.com (Para ello, vamos al menú lateral izquierdo y en la parte superior pulsamos sobre “Páginas indexadas“)

Páginas indexadas de zalando.es desde su creación

Páginas indexadas de Zalando.es

Páginas indexadas de zalando.es en Google

Como podemos observar, Zalando ha procurado desde su existencia mantener bien podado su Dominio y todos conocemos su éxito en Google. Da la casualidad, de que cuando justo se disparó la cantidad de páginas indexadas en Google, su visibilidad se redujo semanas después (ver gráfico de visibilidad para zalando.es).

Páginas indexadas de zara.com desde el año 2010

Páginas de zara.com indexadas en Google

Páginas de zara.com indexadas en Google

Podemos ver que esto de hacer de jardinero no es lo suyo y de ahí sus malas posiciones en el ranking de Google.

¿Qué representa esto en la práctica?

A nivel SEO poco podemos aprender del dominio de zara.com (más que admirar su exquisito diseño), por eso prefiero explicar el modelo de éxito de un buen jardinero como zalando.es. Haciendo uso de Seerobots podemos ver de forma visual qué páginas de zalando.es han sido indexadas por Google, como también el tipo de metaelemento que se ha usado:
INDEX/FOLLOW
-INDEX/NOFOLLOW
-NOINDEX/FOLLOW
-NOINDEX/NOFOLLOW
Por ejemplo, vemos que Zalando permite a Google indexar (y seguir) la página principal para el apartado “Zapatillas“ en Mujer, https://www.zalando.es/zapatillas-mujer/:

Página con index/follow en el meta de zalando.es

Página con index/follow en el meta de zalando.es

Sin embargo, la página #2 de este apartado no proporciona ninguna información con valor añadido y zalando.es consecuentemente le dice a Google, “noindex/follow“:

Página con noindex/follow en el meta de zalando.es

Página con noindex/follow en el meta de zalando.es

¿Qué contenidos indexar y cuales no?

A veces contesto diciendo que la única respuesta 100% correcta en SEO es: “depende“. Depende de muchos factores, pero si partimos del usuario como base, nos deberíamos preguntar si el contenido en cuestión genera algún tipo de información extra, relevante para el usuario, que no haya obtenido antes.

La página #2 de Zapatillas-Mujer es un ejemplo de ello. Igualmente las tallas. Si multiplicamos un tipo de zapatillas deportivas por el número de tallas posibles, por el número de colores, obtendríamos una cantidad descomunal de documentos sin ningún valor añadido. Así que NO vale la pena indexarlo todo, por ejemplo, indexar las tallas. Miremos como lo resuelve zalando.es. El producto es indexado con und index/follow:

Producto indexado sin talla

Producto indexado sin talla

El mismo producto no es indexado para las tallas, noindex/follow:

Producto con no index para las tallas

Producto con noindex para las tallas

Es saludable podar las tallas, ya que no generan ningún valor añadido, a menos que busques “zapatillas de ballet para hombre talla 46“, entonces sí, ya que este sería un producto tan escaso, que lo más lógico es dejarlo indexar por Google.

¿Cuál es el mejor método, robots.txt ó metaetiqueta noindex?

Depende del objetivo, pero la única forma de no ser indexado por Google es haciendo uso de la metaetiqueta NOINDEX: <meta name=”robots” content=”noindex”>

Y esta es la que prefiero. Primero, por la razón anteriormente mencionada, que sólo así no serás indexado en Google y segundo, porque es la que recomienda Google:

“¡Importante! Para que la metaetiqueta noindex sea eficaz, no debes bloquear la página meidante un archivo robots.txt. Si la página está bloqueada mediante un archivo robots.txt, el rastreador no verá la etiqueta noindex, y la página seguirá apareciendo en los resultados de búsqueda si, por ejemplo, otras páginas están enlazadas con ella.“

Fuente: https://support.google.com/webmasters/answer/93710?hl=es.

Fijaros en el texto de robots de zara.com:

robots.txt de zara.com

robots.txt de zara.com

Casi todo esos directorios prohibidos en robots.txt han sido indexados por Google. Por ejemplo, /webapp/wcs/stores/servlet/ShopGuideView:

Contenido bloqueado por robots.txt pero indexado por Google

Contenido bloqueado por robots.txt pero indexado por Google

A pesar de estar bloqueado a través de robots.txt, ha sido indexado. Google simplemente apuesta por las señales del usuario: Basta con un enlace de alguien, un grado determinado de relevancia y Google lo indexa.

Este es el robots.txt de zalando.es:

robots.txt de zalando.es

robots.txt de zalando.es

¿Os habéis preguntado porque zalando.es usa la etiqueta noindex/follow?

El metaelemento <meta name=”robots” content=”index, follow”> le permite tanto Zalando como Google obtener lo que desean. Zalando desea mejores rankings en los resultados de búsqueda y Google obtener información:

1) Es una forma de evitar cualquier cantidad de contenido duplicado diciéndole a Google lo que tiene que indexar y lo que no, sin negarle al Googlebot links valiosos.

2) Según Google, algunas de estas ULRs podrían poseer PageRank aunque no fuese visible (esto lo dijeron cuando Google nos permitía verlo, claro). Por esa razón -y esto es válido aún hoy-, con este método también se podría evitar que algunas URLs de rango inferior se posicionen mejor que la URL que en realidad se desea posicionar, y así, finalmente posicionar en el ranking la URL deseada en la posición ocupada por las URLs indeseadas. Como cortar las ramas al árbol para obtener mejores frutos.

3) Es importante decirle a Google “no gastes tus recursos indexando esta página irrelevante/pero es importante que sepas que también existe“. Así que es una muy buena alternativa a un Sitemap en HTML, ya que le permitirle a un buscador la indexación, tal cual és. No podemos olvidar que Google vive de la información y necesita los links que posee esa URL.

Un buen ejemplo lo da Matt Cutts en uno de sus videos para Webmaster:

Evidentemente al hacer de jardineros no sólo estamos cuidando la salud de nuestro dominio, distribuyendo su autoridad justo ahí, donde debe estar (así como lo hacen los árboles para producir frutos), sino que igualemente estamos mejorando nuestra eficiencia (igual que lo hacen los árboles para crecer). Y esta es la relación existente entre los recursos que Google pone a nuestra disposición y la eficiencia con que los “aprovechamos“ en nuestro dominio.

Espero que le cojáis gustillo a la jardinería y feliz domingo.

 

14. junio 2015, 09:22

Hola Juan,

Interesante post. Estoy muy de acuerdo con él, exceptuando el tema del disallow de las páginas no indexables en el robots.txt. Además del noindex es recomendable hacer disallow para que Google no pierda el tiempo y recursos en visitar esas páginas y así desperdiciar el crawl rate del site.

Si partimos de un site nuevo, o categoría nueva, se debe hacer de salida esto. Si no se debe esperar unos días a que el bot pase por las páginas a desindexarlas y añadirlo a posteriori. También se puede hacer uso de la herramienta de desindexación de GWT.

Saludos!

14. junio 2015, 11:34

En efecto, estoy de acuerdo con el comentario anterior, has dejado de lado la optimización del rastreo. Es una parte fundamental, en el resto, muy buen post. Un saludo!

Juan Gonzalez
14. junio 2015, 12:13

Hola Jesús y Javier,
¡Muchas gracias por vuestros comentarios! Me alegra mucho que os toméis un poco de vuestro tiempo para leer el artículo y comentarlo.

Jesús, tu dices: “Además del noindex es recomendable hacer disallow para que Google no pierda el tiempo…”

Pero Google nos dice justo lo contrario. En el artículo lo he dejado claro citando a Google: “Si la página está bloqueada mediante un archivo robots.txt, el rastreador no verá la etiqueta noindex, y la página seguirá apareciendo en los resultados de búsqueda”

Así que no cumplirías con tu objetivo y harías justo lo contrario de lo que deseas.
¡Un saludo y feliz Domingo!

14. junio 2015, 15:01

Bueno, en la segunda parte del comentario he puesto:

“Si partimos de un site nuevo, o categoría nueva, se debe hacer de salida esto. Si no se debe esperar unos días a que el bot pase por las páginas a desindexarlas y añadirlo a posteriori. También se puede hacer uso de la herramienta de desindexación de GWT.”

Es depende de cada caso, según tu mismo comentasen el post

15. junio 2015, 06:42

¡Hola!

Gracias por el artículo, me ha venido muy bien aunque me ha surgido una pregunta con respecto a la manera en la que estoy paginando mis listados. Lo que yo estoy haciendo es incluir en la página 2 y posteriores, una etiqueta canonical que punta a la página uno e incluir en todas (primera y posteriores) metaetiquetas rel con los valores previuos y next. ¿Sería recomendable añadir además un no index/follow?

Gracias y un saludo,

Alfonso

Juan Gonzalez
15. junio 2015, 10:11

Hola Alfonso,
¡Muchas gracias por tu comentario!
La fuente más fiable para dar respuesta a tu pregunta, es Google: https://support.google.com/webmasters/answer/1663744?hl=es
Por lo que puedo deducir, no hace falta.

Hola Jesús,
Sí, sí, depende 🙂
Pero es importante que sepas una cosa. Desindexar una URL vía GWMT es una solución temporal. Después de 90 días si Google encuentra un enlace con destino al contenido des-indexado, Google volverá a indexar esa URL. Si deseas desindexar permanentemente una URL, lo mejor es el metaelemento NOINDEX.
¡Qué tengáis una buena semana!

15. junio 2015, 10:58

Muy interesante este briconsejo de jardinería (que aprenda el jardinero de bricomanía que sólo sabe recomendar trasplantes y abonos). La duda que me queda es qué criterios usar para establecer cuál es la página que debo ponerle index/follow ¿la primera que suba de todas las tallas o del listado de productos?

Saludos de un agradecido aprendiz de SEO
Oscar Romero
http://www.ohyeeah.com

Juan Gonzalez
16. junio 2015, 15:50

Hola Oscar,
¡Muchas gracias por tu comentario!
Para variar…depende. Pues en el artículo recomiendo poner a las tallas noindex/follow y tu deseas hacer lo opuesto, así que depende del objetivo que tengas. Quizás vendes zapatillas de ballet para hombre talla 44,45 y 46 🙂
Piensa en el valor que tiene esta información para el usuario. En el Enlace que le puse Alfonso puedes también sacar tus conclusiones.

24. noviembre 2015, 16:40

Hola Juan,

He leído un par de veces tu artículo y definitivamente voy a coger las tijeras de podar.
Tengo una pregunta:
En un prestashop, eso se puede desde el panel de admin o tengo que acceder al código HTML de la web y toda la pesca…
Gracias