AI Citation Drift: ¿Qué tan estables son las fuentes en los resultados de búsqueda de IA?

Quien aparece hoy como fuente en una respuesta de IA puede haber desaparecido la semana que viene. Nuestro análisis de 82.619 prompts a lo largo de 17 semanas muestra que Google intercambia semanalmente el 56% de las fuentes en las respuestas de AI Mode, y ChatGPT incluso el 74%. Quién permanece, quién desaparece y por qué es problemático que las tres grandes plataformas apenas tengan algo en común.

Desde mediados de 2025 se debate bajo el término «AI Citation Drift» cuán estables son realmente las referencias a fuentes de IACitations«). El debate fue impulsado por un estudio de Profound centrado en la deriva mensual en el mercado estadounidense. Nosotros hemos analizado el tema con más detalle utilizando datos de SISTRIX, a lo largo de tres plataformas, seis países y 17 semanas.

Los 5 hallazgos más importantes

  1. Cada respuesta de AI Mode tiene un núcleo fijo y un carrusel. En el 86% de todos los prompts existe un núcleo estable formado por pocos dominios; el resto rota un 89% cada semana. La pregunta en GEO no es «¿aparezco en la respuesta?», sino «¿estoy en el núcleo o en el carrusel?».
  2. Tres plataformas, tres arquitecturas. Las AI Overviews son completamente estables en algo más de la mitad de las consultas, las respuestas de AI Mode rotan un 56% por semana y ChatGPT un 74%. Meter las plataformas en el mismo saco distorsiona más de lo que muestra.
  3. Los dominios de marca están anclados. En el 43% de las consultas de marca, el propio dominio está presente durante las 17 semanas; las co-citas a su lado rotan un 70% por semana. Quien es una marca, sigue siendo citado. Quien aparece junto a la marca será reemplazado la semana que viene por otra página.
  4. Las noticias son un billete de ida. Solo el 1,4% de los artículos de noticias citados como fuente permanecen de forma duradera en el citation set. Quien planifica su estrategia de citations a través de contenido editorial de noticias, planifica mal. El contenido evergreen sobrevive sistemáticamente mejor.
  5. El Citation Drift es global y permanente. Las tasas de drift se sitúan de forma consistente entre el 54% y el 59% en los seis países analizados, sin aplanamiento a lo largo del período de 17 semanas. No es un efecto de introducción que se corrija con el tiempo, sino una característica estructural de las plataformas.

Tres plataformas, tres arquitecturas de citation

Los datos de drift publicados hasta ahora para las plataformas de IA son agregados: un número por plataforma, generalmente en base mensual. Como primera aproximación está bien, pero oculta más de lo que muestra. Google AI Overviews, Google AI Mode y ChatGPT Search funcionan de manera fundamentalmente diferente en la selección de citations, y un número promediado convierte tres cosas distintas en una sola.

Gráfico de barras: Citation Drift semanal por plataforma - AI Mode 74%, ChatGPT 56%, AI Overviews 5% Churn-in por semana

Términos:

  • Churn-in describe cuántos de los dominios citados son nuevos en una semana, es decir, que no aparecían la semana anterior.
  • Retention describe cuántos de los dominios de la semana anterior han llegado a la siguiente semana.
  • Peripheral / Carrusel designa todos los dominios en una respuesta de IA que no pertenecen al núcleo estable. Aparecen, desaparecen y son reemplazados semanalmente por otros.
  • Core / Núcleo designa los pocos dominios en una respuesta de IA que permanecen presentes de forma duradera. Su churn-in es prácticamente del 0%: son citados semana tras semana, independientemente de qué otras fuentes entren y salgan.

Google AI Overviews: el círculo cerrado

Las AI Overviews son la más estable de las tres plataformas. En la mediana se citan 11 dominios, de los cuales 8 están presentes de forma permanente. Esto suena tranquilizador en un primer momento, pero la estabilidad se distribuye de forma desigual.

En el 53% de todos los prompts no cambia ni una sola fuente a lo largo de 17 semanas. En el 28% se producen cambios ocasionales. Y en el 19% las fuentes derivan con la misma intensidad que en el AI Mode, con un 46% de churn-in. Las AI Overviews no son uniformemente estables, sino que están divididas entre una mayoría en la que no se mueve nada y una minoría en la que todo rota.

Hemos verificado que esto no es un artefacto de medición: en el 87% de los prompts estables, el texto de respuesta generado cambia de semana en semana, pero los dominios citados permanecen idénticos. Las AI Overviews escriben nuevas frases cada semana, pero recurren a las mismas ocho fuentes. Quien está dentro, se queda. Quien no está, tampoco entra.

Ejemplo: Para „7 trucos para que se coma sus bolitas» las AI Overviews citan exactamente los mismos 11 dominios durante 17 semanas: arquivet.com, barakaldotiendaveterinaria.es, expertoanimal.com y ocho más. Cero movimiento. Para „viaje a una ciudad en navidad», en cambio, el panorama cambia cada semana. Probablemente porque la respuesta a «dónde compro comida para mi mascota» es menos estacional que la pregunta «adónde ir en Navidad».

Google AI Mode: pocos permanecen, muchos cambian

En el AI Mode el panorama es diferente. Por respuesta se citan entre 14 y 16 dominios, de los cuales el 56% cambia cada semana. Suena dramático, y con razón. Pero vale la pena mirar más de cerca: no todos los dominios derivan igual.

El 86,5% de los prompts analizados tienen un núcleo estable de entre 1 y 5 dominios que permanecen presentes durante semanas y meses. El resto de los dominios, en cambio, rotan un 89% por semana.

Ejemplo: Para „antivirus bueno y gratis» masmovil.es permanece en el Core durante todo el período. En la semana 1 aparecen junto a él avira.com, dssolucionesdigitales.com, elpais.com y google.com. En la semana 2 tres de ellos han desaparecido; en su lugar llegan avast.com, bitdefender.com, cybernews.com y lasexta.com. masmovil.es permanece, los demás se van turnando.

¿Quién forma el Core? YouTube y Amazon están frecuentemente representados, lo que no sorprende a nadie. Más destacable: en el 83% de los prompts también hay al menos un dominio especializado en el núcleo estable. No solo ganan las grandes plataformas.

Y todo esto es notablemente independiente del país:

Churn-in y Retention - AI Mode
CountryChurn-in / WeekRetention / WeekDomains / Answer
DE56%46%13.5
US54%49%16.1
UK54%49%15.7
IT59%43%13.7
ES56%44%11.8
FR57%43%12.3

Churn-in y Retention no suman el 100% porque tienen bases de referencia diferentes. Churn-in pregunta: ¿cuántas de las fuentes actuales son nuevas? Retention pregunta: ¿cuántas de las fuentes de la semana pasada siguen estando? Si una respuesta tenía, por ejemplo, ocho fuentes una semana y doce la siguiente, ambos valores tienen una relación diferente con el número total.

ChatGPT Search: fluctuación total

ChatGPT Search es el caso extremo. El 74% de los dominios son nuevos cada semana. Las estructuras de core estables son poco frecuentes: el prompt mediano no tiene ningún dominio presente en las 17 semanas. En comparación: en el AI Mode la mediana es de aproximadamente 2 dominios de core estables por prompt. En ChatGPT sí existen prompts con fuentes estables, pero son la excepción, no la regla.

Además: ChatGPT cita significativamente menos fuentes. En la mediana solo entre 3 y 4 dominios por respuesta, frente a los 14-16 del AI Mode. Y aquí viene lo interesante: incluso en consultas en español, el 68% de las fuentes de core de ChatGPT son en inglés. Quien consulta ChatGPT en España recibe mayoritariamente respuestas de fuentes en inglés.

Ejemplo: Para „¿a qué precio cotizan los futuros del gas natural?» ChatGPT cita en la semana 1 un total de 5 dominios, entre ellos cantabriaeconomica.com, capital.com y cmegroup.com. En la semana 2: 3 dominios en parte diferentes (bloomberg.com, investing.com). En la semana 3: de nuevo en parte diferentes (reuters.com, yahoo.com), bloomberg.com e investing.com permanecen. La respuesta puede sonar plausible cada semana, pero no tiene nada que ver con un uso consistente de las fuentes.

El dominio de marca permanece, el resto rota

Que en una búsqueda de «ikea billy estanterías» acabe citándose ikea.com es poco sorprendente. Lo más interesante es con qué consistencia ocurre y qué sucede con las co-citas a su alrededor.

En Google AI Mode, el propio dominio de marca solo está presente en todas las 17 semanas en el 43% de las consultas de marca. En la mayoría de los casos, incluso la fuente más obvia sale en algún momento del citation set. En el 66% permanece al menos en el 80% de las semanas. Las consultas de marca derivan globalmente un 20% menos que la media (45% vs. 56% de churn-in), es decir, notablemente más estables, pero no radicalmente diferentes.

El patrón real se muestra en las co-citas a su alrededor. Los otros 12-15 dominios citados junto a la marca rotan un 70% por semana. Las marcas fuertes permanecen ancladas, el espacio a su lado se reasigna semanalmente.

Mapa de calor: evolución de citations de IKEA Billy estanterías a lo largo de 17 semanas - ikea.com citado de forma continua y destacada, otros dominios como youtube.com, focus.de y google.com rotan
El gráfico muestra la visibilidad de ikea.com para el prompt alemán «ikea billy regal» (ikea billy estantería)

Ejemplo: Para „como vender en stockx» stockx.com aparece en 17 de 17 semanas. En la semana 1 aparecen junto a él google.com, spocket.co, tiktok.com y youtube.com. En la semana 17 son google.com, shopify.com, tiktok.com y youtube.com. Completamente intercambiados. Solo StockX permanece.

Quien quiera saber si su propio dominio pertenece al Core o a la periferia puede comprobarlo directamente en el SISTRIX Prompt Tracking. Para ello se puede definir a través del Prompt Research un conjunto de prompts relevantes para la propia marca. SISTRIX determina entonces diariamente si la propia marca aparece en las respuestas de los sistemas de IA y con qué frecuencia, y qué dominios se utilizan como fuentes.

Tabla de fuentes (URLs) SISTRIX para Costa Coffee: Top URL www.cozymeal.com/magazine/coffee-chains con 11 menciones, seguido de páginas de cafenero.com y costaireland.ie con logos de marcas

Así se hace visible, por ejemplo, si para la propia marca el propio dominio está permanentemente anclado en el citation set o entra y sale cada semana. SISTRIX para IA y chatbots es gratuito para todas las cuentas. Quien quiera probarlo puede crear una cuenta de prueba gratuita.

¿Qué tipos de dominio sobreviven al Citation Drift?

No todos los tipos de página se ven igual de afectados. Hemos clasificado los dominios citados en categorías y analizado con qué frecuencia logran llegar al núcleo estable de una respuesta.

Google AI Mode: jerarquía clara

Gráfico de barras horizontal: tasa de supervivencia de tipos de dominio en AI Mode - Vídeo/YouTube 24%, Big Tech 16%, Wikipedia 12%, Marketplace 10%, Foros/UGC 3%, Noticias/Medios 1,4%
¿Qué tipos de dominio sobreviven al Citation Drift?
Domain TypeMedian PresenceCore Rate
Video (YouTube)53%24%
Big Tech (Google, Apple, Microsoft)41%16%
Wikipedia24%12%
Marketplace (Amazon, Otto, Zalando)18%10%
News / Media12%1.4%
Forums / UGC (Reddit, Gutefrage)12%3%

YouTube es el claro ganador. La plataforma está presente como fuente en más de la mitad de todas las fechas de referencia y, con una core rate del 24%, es la que más frecuentemente acaba de forma permanente en el núcleo. Que precisamente la plataforma de vídeo propiedad de Google obtenga tan buenos resultados no debería sorprender a nadie.

En el otro extremo del espectro se encuentran los sitios de noticias con una core rate del 1,4%. Los artículos de noticias son en las respuestas de IA un billete de ida. Se citan y una semana después han desaparecido. Para los editores que quieren basar su futuro en GEO, esto no es un mensaje sencillo.

ChatGPT: sin jerarquía clara

En ChatGPT no se aprecia un patrón comparable. Las diferencias entre los tipos de dominio son pequeñas, e incluso los dominios que uno esperaría intuitivamente no aparecen de forma sistemáticamente más frecuente en el núcleo estable que otros. Esto encaja con la imagen de la sección de plataformas: ChatGPT selecciona ampliamente por respuesta, sin que una categoría determinada se imponga de forma duradera. Para GEO esto significa que en ChatGPT ningún tipo de página se perfila como objetivo de optimización fiable.

¿Qué sobrevive? La clasificación de URLs

Hemos clasificado más de 2.500 de las URLs citadas mediante un análisis NLP basado en Gemini según idioma, tipo de contenido, modelo de monetización, estado evergreen y señales E-E-A-T. Esto da como resultado dos perfiles claramente diferenciados para lo que acaba en Core y en Peripheral.

En el Google AI Mode, los dominios de Core son un 80% en alemán (Peripheral: 62%), y el 85% de las URLs de Core son evergreen (Peripheral: 77%). Las páginas de producto y las tiendas dominan el núcleo, los artículos de guía y las noticias rotan. Quien quiera aparecer en el Core del AI Mode en Alemania debería apostar por páginas de producto en alemán y atemporales, no por artículos de revista.

En ChatGPT Search el panorama se invierte. Los dominios de Core tienen una puntuación E-E-A-T de 16/20, los Peripheral solo 14/20 (la diferencia E-E-A-T más notable de todas las plataformas analizadas). El idioma se inclina en sentido contrario: el Core de ChatGPT es un 68% en inglés, incluso en consultas en alemán. La documentación y las fuentes institucionales forman el núcleo, los artículos de guía editoriales rotan.

Las dos plataformas recompensan perfiles de contenido prácticamente opuestos. El idioma, el tipo de contenido y el modelo de monetización son características estructurales de un sitio web que no se pueden transformar de la noche a la mañana para GEO. Para algunos sitios un perfil encaja mejor, para otros ambos, y para otros ninguno. La posición que se ocupa depende de la situación de partida, no solo de la optimización.

Cada plataforma cita fuentes diferentes

Incluso los propios productos de Google apenas coinciden. Para el mismo prompt, las AI Overviews y el AI Mode citan dominios diferentes en un 83% de los casos. El índice de Jaccard, que mide la coincidencia, es de 0,17. En otras palabras: de todos los dominios que aparecen en una de las dos respuestas, solo el 17% aparece en ambas. Entre el AI Mode y ChatGPT la coincidencia es aún menor, con un índice de 0,125.

Ejemplo: „¿cómo puedo ver la televisión online de forma gratuita?»

  • AI Mode cita: check24.de, dslweb.de, hoerzu.de (portales de comparación y guías de TV)
  • ChatGPT cita: arte.tv, zdf.de, 3sat.de (las cadenas directamente)
  • En común: solo joyn.de

Una de las razones de la baja coincidencia reside en las preferencias estructurales de las plataformas. El AI Mode recurre en un 80% a fuentes en español, ChatGPT en un 68% a fuentes en inglés, incluso en consultas en español. Solo este sesgo lingüístico hace que los pools de fuentes de ambas plataformas apenas puedan solaparse para el mercado hispanohablante.

Para GEO esto significa: una estrategia que funciona para el AI Mode a menudo no alcanza a ChatGPT y viceversa. Las estrategias de citation específicas por plataforma no son opcionales, sino un requisito fundamental.

Nivel de dominio vs. nivel de URL: nuestros datos son conservadores

Todos los datos de drift mencionados hasta ahora se basan en comparaciones a nivel de dominio. A nivel de URL, es decir, la subpágina concreta y no solo el sitio web, el drift es aún significativamente mayor: un 85% por semana frente al 74% a nivel de dominio. Incluso cuando un dominio permanece estable en el citation set, Google cambia con frecuencia la subpágina concreta.

Ejemplo: imdb.com permanece como fuente para „action adventure movie». En la semana 1 se enlaza /list/ls594655800/, en la semana 2 /chart/moviemeter/. Una página completamente diferente en el mismo dominio.

Para GEO esto significa: el posicionamiento de una URL individual en las respuestas de IA no es un objetivo de medición sensato. La presencia a nivel de dominio es medible y controlable. Pero qué URL concreta de ese dominio aparece en una semana determinada no se puede controlar.

El Citation Drift es global

Gráfico de columnas: Citation Drift de AI Mode por país - Italia 59%, Francia 57%, Alemania 56%, España 56%, EE.UU. y Reino Unido 54% cada uno de churn-in por semana

Las tasas de drift en Google AI Mode son notablemente consistentes en los seis países analizados: entre el 54% y el 59% de churn-in por semana, independientemente del país y del idioma. El Citation Drift no es un fenómeno exclusivo de EE.UU. o de Alemania, sino una característica estructural de la plataforma.

En ChatGPT, en cambio, se aprecian diferencias entre países. Alemania, con un 74%, es notablemente más volátil que el Reino Unido (60%) y Francia (42%). La causa probablemente reside en la diferente cobertura de rastreo para los distintos idiomas.

A lo largo de todo el período de 17 semanas no se aprecia ninguna tendencia. Sin estabilización, sin aplanamiento. Quien espere el momento en que las plataformas de IA se pongan de acuerdo sobre un conjunto fijo de fuentes, puede esperar mucho tiempo.

¿Qué significa esto para GEO?

Los hallazgos de este estudio se pueden traducir en tres recomendaciones concretas.

  1. Planificación de contenido: evergreen antes que noticias, producto antes que guía.
    Las core rates por tipo de contenido marcan una priorización clara. El contenido evergreen y las páginas de producto y tienda tienen sistemáticamente mayores probabilidades de ser citadas de forma duradera. Los artículos de noticias, con una core rate del 1,4%, son prácticamente inadecuados como objetivo de citation, aunque siguen siendo útiles como formato de tráfico, solo que no como inversión GEO. El vídeo, con una core rate del 24%, es el tipo de contenido más potente de todos. Para las empresas que aún no gestionan un canal de YouTube estructurado, merece la pena echarle un segundo vistazo.
  2. Establecer el foco de plataforma según la situación de partida.
    Las AI Overviews, el AI Mode y ChatGPT citan para la misma pregunta más de un 80% de dominios diferentes. Al mismo tiempo, recompensan perfiles de contenido distintos (páginas de tienda en español en el AI Mode, documentación en inglés en ChatGPT). La mayoría de las empresas están estructuralmente mejor posicionadas para una de las plataformas que para las demás. En lugar de jugar en las tres con el mismo peso, suele ser más sensato elegir la plataforma adecuada como objetivo de optimización y tratar las demás como objetivo de monitorización.
  3. Calibrar las expectativas de GEO.
    Las promesas clásicas del SEO como «posición 1 para la keyword X» no funcionan en las respuestas de IA. GEO es en definitiva la optimización de las casualidades con las que trabajan los LLMs, y con un drift semanal del 56%, una citation individual no es un rendimiento reproducible, sino una instantánea. Para los proyectos, esto significa situar la medición del éxito en la presencia a lo largo del tiempo, no en resultados puntuales, y fijar expectativas claras con los stakeholders: GEO es un proceso continuo, no una optimización puntual con resultado permanente.

Base de datos

Este estudio se basa en el SISTRIX AI Research Index y abarca 82.619 prompts cualificados con 1.548.213 snapshots. Se han registrado seis países (Alemania, EE.UU., Reino Unido, Italia, España, Francia), tres plataformas (Google AI Mode, Google AI Overviews, ChatGPT Search) y 17 semanas desde el 17-12-2025 hasta el 08-04-2026 con fechas de referencia semanales. Adicionalmente se han clasificado 2.556 URLs de fuentes según idioma, tipo de contenido y E-E-A-T.

Todas las métricas de drift se basan en comparaciones a nivel de dominio entre snapshots semanales consecutivos. Las métricas principales son churn-in (proporción de dominios nuevos por semana) y retention (proporción de dominios que sobreviven).

Limitaciones: Los datos de ChatGPT abarcan únicamente prompts con mención consistente de fuentes. Las tasas de drift mencionadas son conservadoras; a nivel de URL son un 15% más altas.

Artículos relacionados