Con la irrupción de la búsqueda con IA ha surgido una nueva categoría de bots: los Userbots de IA. Los User-Agents como ChatGPT-User o Perplexity-User acceden a un sitio web en el momento exacto en que una IA recopila información para una consulta específica de un usuario.
En el sector del SEO, estos accesos se tratan cada vez más como una nueva moneda de cambio. La lógica parece convincente: si un Userbot de IA rastrea mi sitio, mis contenidos se incorporan a la respuesta generada. Más accesos de bots significan mayor visibilidad en la IA.
Esta interpretación es comprensible, pero se queda corta. Al analizar los datos de los Userbots de IA, existen cuatro obstáculos importantes que complican considerablemente el panorama.
1. Los sistemas más utilizados no usan para nada Userbots
Google AI Overviews y el modo IA son, con diferencia, los sistemas de búsqueda con IA más utilizados actualmente. Funcionan principalmente sobre el índice de búsqueda existente. Al responder a una consulta, por lo general no se produce ningún acceso en tiempo real por parte de un Userbot especializado. Todo el proceso permanece invisible en los archivos de registro del servidor.
Esto significa que quien mida su rendimiento en la búsqueda con IA exclusivamente a través de los accesos de Userbots está pasando por alto por completo el canal más importante con diferencia.
2. El acceso no equivale a la mención
En el marco de RAG (Retrieval Augmented Generation), un LLM puede recuperar numerosas fuentes en paralelo para aumentar la densidad de información de una respuesta. Sin embargo, que una página haya sido rastreada en este proceso no significa necesariamente que acabe siendo citada como fuente o incluida en el resultado. El modelo vuelve a filtrar y ponderar en un paso final.
Un acceso de Userbot en los registros es, en el mejor de los casos, una señal de que una página fue considerada como candidata. Si llegó a formar parte de la respuesta final no puede deducirse de este dato.
3. Validación en lugar de generación
Las decisiones clave sobre el contenido de una respuesta se toman en el propio modelo fundacional. En muchos casos, los Userbots sirven únicamente para respaldar o validar con datos actuales las decisiones que el modelo ya ha tomado.
El acceso del Userbot es, por tanto, a menudo un mecanismo de verificación posterior, no un impulsor primario de la respuesta. La causalidad funciona de manera distinta a lo que sugieren los datos de registro. Es decir, no es el acceso al sitio web lo que lleva a la respuesta, sino la respuesta planificada la que lleva al acceso al sitio web.
4. El caché distorsiona la base de datos
Para reducir la latencia y los costes, los sistemas de búsqueda con IA recurren a mecanismos de caché. Un único acceso de Userbot puede servir de base para miles de consultas idénticas de usuarios sin que se generen más entradas en el registro.
Esto distorsiona la base de datos en ambas direcciones, ya que las páginas con pocos accesos de Userbots pueden estar igualmente muy presentes en las respuestas de la IA. Las páginas con muchos accesos de Userbots quizás solo fueron consultadas para una única consulta que fue almacenada en caché posteriormente.
Una comparación histórica: el paralelismo con los meta-buscadores
Los Userbots de IA recuerdan a los primeros tiempos de los meta-buscadores. Estos consultaban en paralelo varios motores de búsqueda tras la consulta del usuario y agregaban el resultado laboriosamente en tiempo real. El principio funcionaba, pero era ineficiente y quedó obsoleto rápidamente cuando Google construyó un índice tan completo y actualizado que la información podía servirse directamente desde una única fuente central.
Conclusión
Los accesos de Userbots de IA son un dato, pero no un indicador fiable de visibilidad en la IA. Representan solo una fracción del panorama real de la búsqueda con IA, no dicen nada sobre si el contenido está realmente incluido en las respuestas y están sistemáticamente distorsionados por los efectos del caché.
Mi pronóstico: la búsqueda con IA evolucionará de manera similar. El acceso en tiempo real mediante Userbot se convertirá en un caso especial reservado a datos volátiles y urgentes, como «¿Está este vuelo todavía disponible en la clase de reserva XY ahora mismo?». Para la gran mayoría de la información, el modelo recurrirá directamente a su conocimiento entrenado o a un índice de alta eficiencia rastreado previamente.
