Contenido duplicado

Con contenido duplicado nos referimos al mismo contenido que son accesible a través de varias URLs. El llamado «contenido duplicado» debe evitarse. El contenido de un sitio web debe ser siempre accesible solo a través de una única URL. De lo contrario, Google tendrá problemas para saber cuál de las URLs debe ser mostrada en sus resultados de búsqueda y a qué URL debe asignar las señales de posicionamiento positivas.

¿Qué es el contenido duplicado?

Se entiende por contenido duplicado (en inglés «Duplicate Content», también abreviado como «DC») a la existencia de contenido idéntico en uno o más sitios web. Se hace una distinción entre contenido duplicado interno y contenido duplicado externo.

El contenido duplicado interno puede surgir solo por el hecho de que el mismo contenido de tu propio dominio sea accesible bajo varias URLs, por ejemplo, por los parámetros de un filtro que se encuentran en la URL.

El contenido duplicado externo puede ocurrir por ejemplo cuando un sitio web está disponible en varios idiomas. Aunque en este caso aparecería con más de una versión en los resultados de búsqueda en el mismo mercado de búsqueda (por ejemplo, google.es)

Contenido duplicado interno y externo

El contenido duplicado interno se restringe al propio dominio/hostname.

El contenido duplicado externo se produce a través de diferentes dominios, es decir, bajo dos o más hosts.

Ejemplo de contenido duplicado interno

Con frecuencia las tiendas online, por ejemplo, tienen que luchar contra el contenido duplicado interno. A menudo, se puede acceder directamente a las páginas de detalles de los productos sin la correspondiente página de categoría y/o producto:

  • http://www.onlineshop-domain.com/category/productpage/productdetailpage
  • http://www.onlineshop-domain.com/productdetailpage

Este contenido será indexado por los motores de búsqueda si, por ejemplo, ambas URLs están enlazadas internamente. Enlaces internos incoherentes o no uniformes son también una razón de contenido duplicado.

Ejemplo de contenido duplicado externo

Hay veces en las que se puede acceder a un sitio web desde diferentes dominios. No hay nada de malo en esto, siempre y cuando cualquier otra variante del dominio se dirija nuevamente al dominio principal a través de una redirección 301.

¿Éste no ha sido el caso? Entonces para Google existen diferentes dominios que tienen el mismo contenido. Esto dificulta al robot de Google evaluar la relevancia de cada página y puede causar problemas en el posicionamiento de dicha web.

Índice de visibilidad SISTRIX donde se comparan 4 dominios que muestran el problema del contenido duplicado externo en Google.de
Tendencias de visibilidad donde se comparan 4 dominios que ofrecen el mismo contenido. Siempre hay momentos en los que Google decide mostrar un dominio diferente en los resultados. Se alternan tres progresiones.

Parece ser que el dominio principal a posicionar es «radio-sws.de». Los contenidos del sitio web «radio-sws.de» se pueden encontrar de forma idéntica en otros tres dominios. Así surge el contenido duplicado externo debido a que el sitio web tiene varios nombres para el dominio. Entonces Google no está seguro de cuál de los cuatro dominios es relevante para el tema y posiciona alternativamente uno y otro.

Lo que NO es contenido duplicado

Si hay un contenido en varios idiomas, como por ejemplo en alemán e inglés, este no será calificado como contenido duplicado. Tampoco citas o pasajes de texto serán identificados como contenido duplicado.

Al citar contenidos se debe respetar el correcto marco semántico en el texto fuente:

<blockquote>Aquí se coloca el texto citado - <cite>Aquí se coloca el nombre del autor citado o la fuente</cite></blockquote>

¿Es el contenido duplicado un problema?

¡Sí! El contenido duplicado no es único y no añade valor para los usuarios. Desde el punto de vista de Google, los contenidos duplicados pueden llegar a ser, en algunos casos, un intento de fraude si los textos de otros sitios web se copian sin autorización.

El contenido duplicado dificulta los esfuerzos de Google para encontrar el mejor resultado posible para el usuario. Por estas razones, los Webmasters deben tomar en serio el tema del contenido duplicado.

El contenido duplicado puede ser responsable de las fluctuaciones en los SERPs (páginas de resultados de búsqueda de Google), es decir, en el posicionamiento de un sitio web. Para Google no está claro qué página ofrece el contenido más relevante para una consulta de búsqueda determinada, por lo que las URLs de destino de los resultados de búsqueda pueden cambiar rápidamente.

Google intenta resolver por sí mismo los problemas de contenido duplicado

Google intenta identificar por sí mismo el contenido duplicado y decide de forma independiente qué contenido es más relevante para la consulta de búsqueda del usuario, y muestra este resultado en los SERPs.

Durante la indexación previa del contenido Google también intenta identificar la mejor versión (URL) posible del contenido duplicado y, si es posible, indexa solo este.

Si el posicionamiento y el tráfico de un sitio web son constantes a pesar de un problema de contenido duplicado existente y, posiblemente una fluctuación en el número de páginas indexadas, entonces el problema del contenido duplicado no es, de momento, perjudicial para el rendimiento del sitio web.


Detectar el contenido duplicado en tu sitio web

En SISTRIX puedes realizar un análisis OnPage automatizado de tus sitios web y ver todos los errores SEO relevantes. Los detalles y explicaciones específicas de cada tipo de error las tienes disponibles en la página resumen de la optimización OnPage.

El Optimizer SISTRIX muestra el contenido duplicado en detalle para cada URL.

Advertencia de Error en el Optimizer SISTRIX sobre la existencia de Contenido Duplicado en tu sitio web.
Error en el Optimizer SISTRIX que señala automáticamente el contenido duplicado.

En la fase de prueba gratuita de la herramienta SISTRIX puedes crear un proyecto de análisis Onpage para examinar tu sitio web y ver si hay contenido duplicado, entre otras cosas. Prueba SISTRIX de forma gratuita durante un periodo de prueba de 7 días, sin ningún coste.

Lo que dice Google

A Google le preocupa mucho indexar y mostrar páginas con información diferente. (...) En los raros casos en los que tengamos que asumir que el contenido duplicado se muestra con la intención de manipular el ranking o engañar a nuestros usuarios, haremos las correcciones apropiadas en el índice y ranking de esos sitios. Como resultado, es posible que estos sitios se clasifiquen en un rango inferior en los resultados de búsqueda o incluso que se eliminen del índice de Google y dejen de aparecer en los resultados de búsqueda.

Fuente: Google-Search-Console-Hilfe

Conclusión

Desde el punto de vista de Google, los contenidos duplicados no aportan ningún valor añadido a los usuarios e incluso pueden clasificarse como Spam si los textos se copian simplemente de otras páginas. Los duplicados entorpecen los esfuerzos de Google por conseguir el mejor resultado posible para el usuario. El contenido duplicado externo no siempre conduce inmediatamente a una penalización por parte de Google, pero un problema persistente de contenido duplicado puede causar un daño a largo plazo al sitio web.

Más información sobre este tema

Google

Cómo evitar que se cree contenido duplicado – Herramientas ayuda Google Search Console

SISTRIX

Cómo analizar la canibalización SEO de palabras clave y urls