Directiva de Copyright de la UE: el contenido periodístico es casi irrelevante para Google

Los Uploadfilter han modificado el debate público en torno a la directiva de derechos de autor de la Unión Europea, lo que ha hecho que se haya fundado otro instrumento legislativo: la llamada copyright Law for Press Publishers. Queríamos comprobar la relevancia de estos contenidos para Google, y el resultado muestra que Google realiza la mayor parte de su negocio sin utilizar el contenido de los editores de prensa.

El tema de la copyright Law for Press Publishers también ha llegado a Europa en el marco de la nueva Directiva de Derechos de Autor de la UE. Una de las cuestiones clave es si la exhibición de los Snippets relacionados con el contenido periodístico estarán cubiertos por una licencia. Lo que obligaría a Google a pagar a los editores.

Para entender la importancia que estos contenidos periodísticos tienen para Google, hemos revisado y analizado nuestras bases de datos para identificar el tamaño y la relevancia de este sector en los resultados de búsqueda. Los siguientes datos se refieren únicamente a España.

Nuestro análisis de datos

En primer lugar hemos definido qué resultados se verían afectados por esta legislación. Dado que no existe una lista pública y vinculante, hemos decidido considerar todos aquellos dominios que hayan publicado al menos cinco artículos durante la última semana en Google News (Onebox). Hemos ajustado el resultado a dominios que obviamente no proporcionan contenido periodístico en su mayor parte. El resultado es una lista de 1.431 dominios que sirven de base de datos para los siguientes análisis.

Solo el 0,23% de las consultas de búsqueda comercial tienen carácter periodístico.

En primer lugar queríamos saber qué tan relevante es el contenido periodístico para las palabras clave que utiliza Google para ganar dinero en las búsquedas de Google (Google News no contiene anuncios).

Para ello, medimos el número de palabras clave para las que los dominios de la lista de 1.431 dominios constituyen al menos cinco de los diez resultados de búsqueda orgánicos habituales en la primera página y además, como indicador del valor de la búsqueda de Google, también se muestra la publicidad (Google Ads o Google Shopping).

El resultado es sorprendentemente bajo: de los más de 12 millones (exactamente: 12.620.212) de términos de búsqueda examinados, solo 29.617 tienen un impacto periodístico en los resultados de búsqueda orgánicos y se muestran adicionalmente en los anuncios. Esto significa que solo el 0,23% de los términos de búsqueda periodísticos son también comercialmente relevantes para Google.

Gráfico explicativo sobre la importancia del Contenido periodístico en Google

El 5.26% de los términos de búsqueda tienen naturaleza periodística

Como siguiente análisis queríamos saber cuántos términos de búsqueda son característicos del contenido periodístico en Google. Para ello, medimos el número de palabras clave para las que los dominios de la lista tienen al menos cinco de los diez resultados habituales de la primera página.

De los más de 12 millones de términos de búsqueda analizados, solo 663.749 tratan términos de búsqueda que tienen dicha naturaleza. Esto significa que el 5,26% de los términos de búsqueda en Google son periodísticos. La misma evaluación, con solo siete y no cinco resultados en la primera página de resultados de búsqueda, se traduce en una cuota de solo el 2,01% de los términos de búsqueda fuertemente acuñados periodísticamente.

El 13,65% de los resultados totales proceden de ámbitos periodísticos

Por último, queríamos saber cuántos resultados totales provenían de dominios periodísticos. En total, evaluamos algo más de 520 millones de resultados de búsqueda en Google (524.574.916 para ser exactos). Estos resultados de Google proporcionan una imagen representativa del comportamiento de búsqueda en España en Google.es.

De estos 520 millones de resultados, cerca de 71 millones de resultados (exactamente: 71.581.493) provienen de dominios de la lista de dominios definida anteriormente. Por lo que según nuestro análisis de datos, el 13,65% de las consultas de Google se ven afectadas actualmente por el nuevo reglamento de la UE.

Por lo que los 50 dominios periodísticos más exitosos de Google ya representan el 5,56% de las visitas de Google y por lo tanto, son responsables de una gran parte de los resultados afectados.

Conclusión

Desde 2013 existe en Alemania la copyright Law for Press Publishers. Esta no ha llevado a Google a pagar ningún derecho de autor a los editores. En España, una directiva similar ha provocado la suspensión de Google News y de muchos servicios similares, lo que ha provocado una pérdida de tráfico para un porcentaje significativo de pequeñas editoriales (estudio) y para que grandes periódicos como El País adopten una postura pública en contra de esta legislación

Hoy en día ya es posible un control exhaustivo de la indexación y visualización de los resultados de búsqueda en los resultados de búsqueda de Google. Cada operador de sitio puede prohibir completamente la indexación (robots.txt) o controlar en gran medida la visualización de Snippets de cada documento individualmente (meta robots).

Sin embargo, nadie ha logrado todavía cuadrar un círculo: conseguir que ambos aparezcan en los resultados de Google con su Snippet para beneficiarse del tráfico, así como también obtener los derechos de autor adicionales. Basándonos en nuestra evaluación, queda claro que el contenido periodístico no es lo suficientemente relevante desde el punto de vista comercial para Google. A la hora de la verdad, Google podrá vivir sin estos resultados en sus listas de resultados.

Artículos relacionados