Con contenido duplicado nos referimos al mismo contenido que son accesible a través de varias URLs. El llamado «contenido duplicado» debe evitarse. El contenido de un sitio web debe ser siempre accesible solo a través de una única URL. De lo contrario, Google tendrá problemas para saber cuál de las URLs debe ser mostrada en sus resultados de búsqueda y a qué URL debe asignar las señales de posicionamiento positivas.
- ¿Qué es el contenido duplicado?
- Contenido duplicado interno y externo
- Ejemplo de contenido duplicado interno
- Ejemplo de contenido duplicado externo
- Lo que NO es contenido duplicado
- ¿Es el contenido duplicado un problema?
- Google intenta resolver por sí mismo los problemas de contenido duplicado
- Detectar el contenido duplicado en tu sitio web
- Conclusión
- Más información sobre este tema
- SISTRIX
¿Qué es el contenido duplicado?
Se entiende por contenido duplicado (en inglés «Duplicate Content», también abreviado como «DC») a la existencia de contenido idéntico en uno o más sitios web. Se hace una distinción entre contenido duplicado interno y contenido duplicado externo.
El contenido duplicado interno puede surgir solo por el hecho de que el mismo contenido de tu propio dominio sea accesible bajo varias URLs, por ejemplo, por los parámetros de un filtro que se encuentran en la URL.
El contenido duplicado externo puede ocurrir por ejemplo cuando un sitio web está disponible en varios idiomas. Aunque en este caso aparecería con más de una versión en los resultados de búsqueda en el mismo mercado de búsqueda (por ejemplo, google.es)
- Échale un ojo a: ¿Es posible identificar contenido duplicado a través del historial del Índice de Visibilidad?
Contenido duplicado interno y externo
El contenido duplicado interno se restringe al propio dominio/hostname.
El contenido duplicado externo se produce a través de diferentes dominios, es decir, bajo dos o más hosts.
Ejemplo de contenido duplicado interno
Con frecuencia las tiendas online, por ejemplo, tienen que luchar contra el contenido duplicado interno. A menudo, se puede acceder directamente a las páginas de detalles de los productos sin la correspondiente página de categoría y/o producto:
- http://www.onlineshop-domain.com/category/productpage/productdetailpage
- http://www.onlineshop-domain.com/productdetailpage
Este contenido será indexado por los motores de búsqueda si, por ejemplo, ambas URLs están enlazadas internamente. Enlaces internos incoherentes o no uniformes son también una razón de contenido duplicado.
Ejemplo de contenido duplicado externo
Hay veces en las que se puede acceder a un sitio web desde diferentes dominios. No hay nada de malo en esto, siempre y cuando cualquier otra variante del dominio se dirija nuevamente al dominio principal a través de una redirección 301.
¿Éste no ha sido el caso? Entonces para Google existen diferentes dominios que tienen el mismo contenido. Esto dificulta al robot de Google evaluar la relevancia de cada página y puede causar problemas en el posicionamiento de dicha web.
Parece ser que el dominio principal a posicionar es «radio-sws.de». Los contenidos del sitio web «radio-sws.de» se pueden encontrar de forma idéntica en otros tres dominios. Así surge el contenido duplicado externo debido a que el sitio web tiene varios nombres para el dominio. Entonces Google no está seguro de cuál de los cuatro dominios es relevante para el tema y posiciona alternativamente uno y otro.
Lo que NO es contenido duplicado
Si hay un contenido en varios idiomas, como por ejemplo en alemán e inglés, este no será calificado como contenido duplicado. Tampoco citas o pasajes de texto serán identificados como contenido duplicado.
Al citar contenidos se debe respetar el correcto marco semántico en el texto fuente:
<blockquote>Aquí se coloca el texto citado - <cite>Aquí se coloca el nombre del autor citado o la fuente</cite></blockquote>
¿Es el contenido duplicado un problema?
¡Sí! El contenido duplicado no es único y no añade valor para los usuarios. Desde el punto de vista de Google, los contenidos duplicados pueden llegar a ser, en algunos casos, un intento de fraude si los textos de otros sitios web se copian sin autorización.
El contenido duplicado dificulta los esfuerzos de Google para encontrar el mejor resultado posible para el usuario. Por estas razones, los Webmasters deben tomar en serio el tema del contenido duplicado.
El contenido duplicado puede ser responsable de las fluctuaciones en los SERPs (páginas de resultados de búsqueda de Google), es decir, en el posicionamiento de un sitio web. Para Google no está claro qué página ofrece el contenido más relevante para una consulta de búsqueda determinada, por lo que las URLs de destino de los resultados de búsqueda pueden cambiar rápidamente.
Google intenta resolver por sí mismo los problemas de contenido duplicado
Google intenta identificar por sí mismo el contenido duplicado y decide de forma independiente qué contenido es más relevante para la consulta de búsqueda del usuario, y muestra este resultado en los SERPs.
Durante la indexación previa del contenido Google también intenta identificar la mejor versión (URL) posible del contenido duplicado y, si es posible, indexa solo este.
Si el posicionamiento y el tráfico de un sitio web son constantes a pesar de un problema de contenido duplicado existente y, posiblemente una fluctuación en el número de páginas indexadas, entonces el problema del contenido duplicado no es, de momento, perjudicial para el rendimiento del sitio web.
Detectar el contenido duplicado en tu sitio web
En SISTRIX puedes realizar un análisis OnPage automatizado de tus sitios web y ver todos los errores SEO relevantes. Los detalles y explicaciones específicas de cada tipo de error las tienes disponibles en la página resumen de la optimización OnPage.
El Optimizer SISTRIX muestra el contenido duplicado en detalle para cada URL.
En la fase de prueba gratuita de la herramienta SISTRIX puedes crear un proyecto de análisis Onpage para examinar tu sitio web y ver si hay contenido duplicado, entre otras cosas. Prueba SISTRIX de forma gratuita durante un periodo de prueba de 7 días, sin ningún coste.
Lo que dice Google
A Google le preocupa mucho indexar y mostrar páginas con información diferente. (...) En los raros casos en los que tengamos que asumir que el contenido duplicado se muestra con la intención de manipular el ranking o engañar a nuestros usuarios, haremos las correcciones apropiadas en el índice y ranking de esos sitios. Como resultado, es posible que estos sitios se clasifiquen en un rango inferior en los resultados de búsqueda o incluso que se eliminen del índice de Google y dejen de aparecer en los resultados de búsqueda.
Fuente: Google-Search-Console-Hilfe
Conclusión
Desde el punto de vista de Google, los contenidos duplicados no aportan ningún valor añadido a los usuarios e incluso pueden clasificarse como Spam si los textos se copian simplemente de otras páginas. Los duplicados entorpecen los esfuerzos de Google por conseguir el mejor resultado posible para el usuario. El contenido duplicado externo no siempre conduce inmediatamente a una penalización por parte de Google, pero un problema persistente de contenido duplicado puede causar un daño a largo plazo al sitio web.
Más información sobre este tema
Cómo evitar que se cree contenido duplicado – Herramientas ayuda Google Search Console
SISTRIX
Cómo analizar la canibalización SEO de palabras clave y urls