Directiva de Copyright de la UE: el contenido periodístico es casi irrelevante para Google

Johannes Beus
Johannes Beus
25. junio 2019
Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Los Uploadfilter han modificado el debate público en torno a la directiva de derechos de autor de la Unión Europea, lo que ha hecho que se haya fundado otro instrumento legislativo: la llamada copyright Law for Press Publishers. Queríamos comprobar la relevancia de estos contenidos para Google, y el resultado muestra que Google realiza la mayor parte de su negocio sin utilizar el contenido de los editores de prensa.

El tema de la copyright Law for Press Publishers también ha llegado a Europa en el marco de la nueva Directiva de Derechos de Autor de la UE. Una de las cuestiones clave es si la exhibición de los Snippets relacionados con el contenido periodístico estarán cubiertos por una licencia. Lo que obligaría a Google a pagar a los editores.

Para entender la importancia que estos contenidos periodísticos tienen para Google, hemos revisado y analizado nuestras bases de datos para identificar el tamaño y la relevancia de este sector en los resultados de búsqueda. Los siguientes datos se refieren únicamente a España.

Nuestro análisis de datos

En primer lugar hemos definido qué resultados se verían afectados por esta legislación. Dado que no existe una lista pública y vinculante, hemos decidido considerar todos aquellos dominios que hayan publicado al menos cinco artículos durante la última semana en Google News (Onebox). Hemos ajustado el resultado a dominios que obviamente no proporcionan contenido periodístico en su mayor parte. El resultado es una lista de 1.431 dominios que sirven de base de datos para los siguientes análisis.

Solo el 0,23% de las consultas de búsqueda comercial tienen carácter periodístico.

En primer lugar queríamos saber qué tan relevante es el contenido periodístico para las palabras clave que utiliza Google para ganar dinero en las búsquedas de Google (Google News no contiene anuncios).

Para ello, medimos el número de palabras clave para las que los dominios de la lista de 1.431 dominios constituyen al menos cinco de los diez resultados de búsqueda orgánicos habituales en la primera página y además, como indicador del valor de la búsqueda de Google, también se muestra la publicidad (Google Ads o Google Shopping).

El resultado es sorprendentemente bajo: de los más de 12 millones (exactamente: 12.620.212) de términos de búsqueda examinados, solo 29.617 tienen un impacto periodístico en los resultados de búsqueda orgánicos y se muestran adicionalmente en los anuncios. Esto significa que solo el 0,23% de los términos de búsqueda periodísticos son también comercialmente relevantes para Google.

Gráfico explicativo sobre la importancia del Contenido periodístico en Google

El 5.26% de los términos de búsqueda tienen naturaleza periodística

Como siguiente análisis queríamos saber cuántos términos de búsqueda son característicos del contenido periodístico en Google. Para ello, medimos el número de palabras clave para las que los dominios de la lista tienen al menos cinco de los diez resultados habituales de la primera página.

De los más de 12 millones de términos de búsqueda analizados, solo 663.749 tratan términos de búsqueda que tienen dicha naturaleza. Esto significa que el 5,26% de los términos de búsqueda en Google son periodísticos. La misma evaluación, con solo siete y no cinco resultados en la primera página de resultados de búsqueda, se traduce en una cuota de solo el 2,01% de los términos de búsqueda fuertemente acuñados periodísticamente.

El 13,65% de los resultados totales proceden de ámbitos periodísticos

Por último, queríamos saber cuántos resultados totales provenían de dominios periodísticos. En total, evaluamos algo más de 520 millones de resultados de búsqueda en Google (524.574.916 para ser exactos). Estos resultados de Google proporcionan una imagen representativa del comportamiento de búsqueda en España en Google.es.

De estos 520 millones de resultados, cerca de 71 millones de resultados (exactamente: 71.581.493) provienen de dominios de la lista de dominios definida anteriormente. Por lo que según nuestro análisis de datos, el 13,65% de las consultas de Google se ven afectadas actualmente por el nuevo reglamento de la UE.

Por lo que los 50 dominios periodísticos más exitosos de Google ya representan el 5,56% de las visitas de Google y por lo tanto, son responsables de una gran parte de los resultados afectados.

Conclusión

Desde 2013 existe en Alemania la copyright Law for Press Publishers. Esta no ha llevado a Google a pagar ningún derecho de autor a los editores. En España, una directiva similar ha provocado la suspensión de Google News y de muchos servicios similares, lo que ha provocado una pérdida de tráfico para un porcentaje significativo de pequeñas editoriales (estudio) y para que grandes periódicos como El País adopten una postura pública en contra de esta legislación

Hoy en día ya es posible un control exhaustivo de la indexación y visualización de los resultados de búsqueda en los resultados de búsqueda de Google. Cada operador de sitio puede prohibir completamente la indexación (robots.txt) o controlar en gran medida la visualización de Snippets de cada documento individualmente (meta robots).

Sin embargo, nadie ha logrado todavía cuadrar un círculo: conseguir que ambos aparezcan en los resultados de Google con su Snippet para beneficiarse del tráfico, así como también obtener los derechos de autor adicionales. Basándonos en nuestra evaluación, queda claro que el contenido periodístico no es lo suficientemente relevante desde el punto de vista comercial para Google. A la hora de la verdad, Google podrá vivir sin estos resultados en sus listas de resultados.

Artículos relacionados
Comentarios
David Esteve   
26. junio 2019, 11:22

Muy interesante reflexión Johannes.

Sin embargo, creo que estas equivocado diciendo que este producto no es lo suficiente relevante económicamente hablando para Google. Me explico.

El estudio que has hecho está basado en los potenciales ingresos que obtendría Google por los ads para querys de usuarios que buscan noticias. El tema es que para Google los ads se la pelan en esos resultados, básicamente. El reto que quieren conseguir con las noticias y su Top Stories es ni más ni menos que algo mucho más valioso que la publicidad, y es mantener al usuario dentro de su ecosistema ya que de no disponer de ese servicio, perderían principalmente 2 cosas:

1. El usuario iría a otro buscador/app/plataforma a informarse.
2. El conocimiento del usuario por parte de Google sería mucho menos completo, perdiendo un valor incalculable sobre su orientación política, sus intereses, habitos de consumo etc.

No olvidemos que el mismo usuario que consume esas noticias gratis es el que pincha en los ads para otras búsquedas más transaccionales y que gran parte de la personalización que recibe ese usuario en sus anuncios viene dado de sus hábitos de búsqueda (también de noticias). Ej. Hoy está en tendencia «ola de calor», el usuario está preocupado: ¿hasta cuando durará?, ¿cuántos muertos hubo el año pasado? pues no te preocupes que esta información es gratis pero vas a ver anuncios de ventiladores hasta que esté nevando.

Luego obviamos apps como Google News, la aplicación de noticias más instalada a nivel mundial (menos en España por motivos obvios) y por último que desde 2018 Google está sacando tajada con su «Suscribe with Google» para que los usuarios puedan suscribirse a otros periódicos a través de su plataforma con lo cual «clink clink» $$$.

En fin, hay incluso estudios que evalúan las ganancias de Google con las noticias en 4.700 millones de dólares en 2018. (http://www.newsmediaalliance.org/wp-content/uploads/2019/06/Google-Benefit-from-News-Content.pdf)

Vamos, que el hecho de que no haya Ads, no significa que a Google le haga polvo prescindir de los editores. Están preocupados, y mucho 🙂

Daniel García la Torre   
27. junio 2019, 09:55

Hola David,

muchas gracias por tu comentario. ¡Me encanta leerte por aquí!! 🙂🙂 Hemos hablado con Johannes y me ha ofrecido la posibilidad de contestar en su nombre.

Tal y como pudiste leer en el blogpost, lo que pretendemos con este estudio no es más que demostrar que Google no gana dinero con las editoriales.

El estudio al que haces referencia en tu comentario ha sido criticado por muchos profesionales y críticos del sector ya que se basa en datos ficticios. Aquí puedes leer un artículo de Jeff Jarvis en el que explica los problemas de ese estudio y los problemas reales de las editoriales: https://medium.com/whither-news/news-publishers-go-to-war-with-the-internet-and-we-all-lose-cc8aca5336f5

El reto que tienen las editoriales es entender que son productos totalmente sustituibles. Todos hacen y ofrecen los mismo ya que todos se fijan en lo que hace el resto. Por este motivo, el usuario está aun solo clic de distancia de otro producto. Si una editorial desapareciese, otra ocuparía rápidamente su lugar. En octubre de 2014, Axel Springer bloqueó el uso de sus noticias de diferentes medios (welt.de, computerbild.de, sportbild.de y autobild.de) a Google en Alemania. El resultado fue una pérdida del 43% del tráfico total de este grupo editorial y en cambio, a Google le es «indiferente» ya que ofrece 9 resultados más 😉

Un ejemplo de ello es la proliferación de FakeNews, donde la mayoría de los usuarios, no hacen una diferenciación entre los diferentes diarios. Realmente no les importa el origen de la información y la transmiten sin preocuparse de la fiabilidad de la misma.

Tal y como dice Jeff: “The problem has long been that publishers aren’t competent at exploiting the full value of these clicks by creating meaningful and valuable ongoing relationships with the people sent their way”.

¡Que tengas un buen día David!

Un abrazo enorme desde Bonn,
Daniel

David   
10. julio 2019, 10:58

Está claro que en estos últimos años, se han visto mermada la calidad de muchos supuestos portales de noticias, los periódicos online, pero creo que no todos deberían de ser igual. Existirán todavía los portales de gran calidad, que mantendrán una calidad de enlaces salientes y entrantes y que desde el cual conseguir un buen enlace costará bastante más conseguirlo, pero nos ofrecerá unos muy buenos resultados de posicionamiento.
Desde mi punto de vista, tendremos que mirar nuevas acciones que puedan aportar más para Google y para el usuario.

Kris Chile   
20. julio 2019, 16:42

Artículo muy interesante! Parece que la UE solo lo hace más difícil con sus directivas. Ya veremos cómo lo que pasara en el futuro cercano.

Saludos
Kris

Pasados 30 días no será posible publicar más comentarios.