¿Necesitamos un índice web público?

Casi ninguna semana transcurre sin que se critique el manejo que hace Google de su propio poder de mercado. Dirk Lewandowski, profesor de Haw Hamburg, ha propuesto un índice web público como alternativa a Google. ¿Podría funcionar?

En la actualidad, Google es actualmente con más frecuencia el tema de mayor cobertura en Google News, que a lo que al propio buscador le gustaría. Solo en los últimos días, por ejemplo, VG Media ha exigido 1.240 millones de euros a Google basándose en la nueva ley de derechos de autor. Google pronto tendrá que proponer alternativas en Android a Google Search y Chrome bajo la presión de la Comisión de la UE, y la queja de Idealo de los 500 millones de euros que sigue siendo bastante reciente.

En este contexto Dirk Lewandowski, profesor de Investigación de Información y Recuperación de Información en Haw Hamburg y uno de los «Profesores de Motores de Búsqueda» de Europa, ha propuesto (versión PDF) gestionar las partes individuales de un motor de búsqueda por separado:

Una propuesta para construir un índice de la web que separe la parte de infraestructura del motor de búsqueda – el índice – de la parte de servicios que formará la base para una infinidad de motores de búsqueda y otros servicios que utilizan datos de la web en la parte superior de una infraestructura pública abierta a todos.

https://arxiv.org/abs/1903.03846

Como un problema central él ve el hecho de que cuando se diseña un algoritmo de posicionamiento, la visión del mundo de los autores siempre entra en juego – y por lo tanto no se dan resultados realmente neutrales e imparciales. Que Google tenga más del 90% de cuota de mercado, lo convierte en un problema.

Figure one that explains Separating services from infrastructure

La solución: separación de rastreo/índice así como del frontend/algoritmo del motor de búsqueda. En base a una infraestructura pública se creará una amplia gama de diferentes proveedores de servicios de búsqueda que harán posible la diversidad que se necesita con urgencia.

¿Esto puede funcionar? Soy bastante escéptico por las siguientes razones:

Google es dueño de todo el «montón»

Google ahora posee (en el sentido más formal de la palabra) una gran parte de internet. Empieza por abajo: el servidor DNS público y gratuito de Google es el servidor DNS de uso más frecuente, con Android Google posee con diferencia el sistema operativo de smartphone de mayor éxito, las cuotas de mercado de Chrome en escritorio alcanzan regularmente nuevos niveles, además de Google Analytics, no hay competidores con cuotas de mercado importantes. Esta lista podría ser interminable. Y si Google todavía no ha obtenido la pieza necesaria del rompecabezas, la comprará, como en el caso de las ofertas de búsqueda de Apple y Firefox.

Búsqueda en la era del ML: la multitud marca la diferencia

Si los datos son el nuevo petróleo u oro aún no se ha aclarado de forma concluyente (solo que ya no puedo escuchar). Pero una cosa está clara: en esencia, la afirmación es correcta. En la era del Machine Learning, el hardware y el software son en gran medida públicos. La diferencia entre un buen y un mal resultado son los Trainingsdata que se utilizan para crear el algoritmo. Y aquí Google tiene una gran ventaja: por un lado, Google tiene acceso a mucho más que solo datos de búsqueda, como se ha descrito anteriormente. Por otro lado, el volumen de búsqueda en áreas de búsqueda con Long Tail es lo suficientemente grande como para lograr resultados significativos. Lewandowski sugiere que los datos de los usuarios de los motores de búsqueda individuales se retroalimenten en todo el sistema. Sin embargo, me atrevo a dudar de que esto pueda compensar las desventajas estructurales.

El cambio es difícil

Hay alternativas a Google. Objetivamente medidas, incluso existen también muy buenas alternativas. Y sin embargo, casi todo el mundo quiere resultados de búsqueda en Google. La confianza en la marca Google que ha crecido a lo largo de los años y es tan grande en el mercado de las búsquedas que es difícil convencer a los usuarios de que cambien. Los usuarios prefieren los resultados de Bing en el Layout de Google a los resultados de Google en el diseño de Bing. Una alternativa de éxito deberá ser significativamente mejor que Google para activar un cambio a un nuevo motor de búsqueda.

Conclusión

Cualquier impulso para una mayor diversidad en el panorama de los motores de búsqueda europeos es útil y bienvenido. La idea de proporcionar rastreadores e índices como una especie de servicio público básico en Europa y, de esta manera, proporcionar más competencia es comprensible desde un punto de vista académico. Sin embargo, soy escéptico de que funcione en la realidad de internet. Pero la UE ya ha financiado muchas cosas. Quién sabe si vale la pena intentarlo.

Artículos relacionados