AI Citation Drift: ¿Qué tan estables son las fuentes en los resultados de búsqueda de IA?

Johannes Beus

(Autor)

Publicado: 01.05.2026

Modificado: 12.05.2026

Quien aparece hoy como fuente en una respuesta de IA puede haber desaparecido la semana que viene. Hemos analizado un total de 82.619 prompts a lo largo de 17 semanas y se observa que Google intercambia semanalmente el 56% de las fuentes en las respuestas de AI Mode, y ChatGPT lo hace incluso el 74%. Quién permanece, quién desaparece y por qué es problemático que las tres grandes plataformas apenas tengan algo en común.

Contenido

Los 5 hallazgos más importantes
Tres plataformas, tres arquitecturas de citación
Google AI Overviews: el círculo cerrado
Google AI Mode: pocos permanecen, muchos cambian
ChatGPT Search: fluctuación total
El dominio de marca permanece, el resto rota
¿Qué tipos de dominio sobreviven al Citation Drift?
Google AI Mode: jerarquía clara
ChatGPT: sin jerarquía clara
¿Qué sobrevive? La clasificación de URLs
Cada plataforma cita fuentes diferentes
Nivel de dominio vs. nivel de URL: los datos son conservadores
El Citation Drift es global
¿Qué significa esto para GEO?
Base de datos

Desde mediados de 2025 se debate bajo el término «AI Citation Drift» (volatilidad de citaciones) cuán estables son realmente las referencias a fuentes de IA («Citations«). El debate fue impulsado por un estudio de Profound centrado en la variación mensual en el mercado estadounidense. Nosotros hemos analizado este tema con más detalle utilizando datos de SISTRIX, para tres plataformas, seis países y 17 semanas.

Los 5 hallazgos más importantes

Cada respuesta de AI Mode tiene un núcleo fijo y un carrusel. En el 86% de todos los prompts existe un núcleo estable formado por pocos dominios; el resto rota un 89% cada semana. La pregunta en GEO no es «¿Aparezco en la respuesta?», sino «¿Estoy en el núcleo o en el carrusel?».
Tres plataformas, tres arquitecturas. Las AI Overviews son completamente estables en algo más de la mitad de las consultas, las respuestas de AI Mode rotan un 56% a la semana y ChatGPT un 74%. Meter todas las plataformas en el mismo saco oculta más de lo que revela.
Los dominios de marca están anclados. En el 43% de las consultas de marca, el propio dominio está presente durante las 17 semanas, mientras que las co-citas rotan un 70% a la semana. Quien es una marca, sigue siendo citado. Quien aparece junto a la marca probablemente será reemplazado la semana que viene por otra página.
Las noticias son un billete de ida. Solo el 1,4% de los artículos de noticias citados como fuente permanecen de forma duradera en el conjunto de citaciones. Quien planifica su estrategia de citaciones a través de contenido editorial de noticias, planifica mal. El contenido Evergreen sobrevive sistemáticamente mejor.
La volatilidad de citaciones es global y permanente. Las tasas de volatilidad se sitúan de forma consistente entre el 54% y el 59% en los seis países analizados, sin estabilizarse durante el período de 17 semanas. No se trata de un efecto inicial que vaya a reducirse con el tiempo, sino más bien de una característica estructural de las plataformas.

Tres plataformas, tres arquitecturas de citación

Los datos de volatilidad publicados hasta ahora para las plataformas de IA se agregan de la siguiente manera: un número por plataforma, generalmente con una base mensual. Como primera aproximación está bien, pero oculta más de lo que muestra. Google AI Overviews, Google AI Mode y ChatGPT Search funcionan de manera fundamentalmente diferente en la selección de citaciones, y una media convierte tres cosas distintas en una única.

Gráfico de barras: Citation Drift semanal por plataforma - AI Mode 56%, ChatGPT 74%, AI Overviews 5% Churn-in por semana

Términos:

Churn-in describe cuántos de los dominios citados son para esa semana nuevos. Es decir, no aparecían la semana anterior.
Retention describe cuántos de los dominios de la semana anterior siguen mostrándose en la siguiente semana.
Peripheral / Carrusel designa todos los dominios en una respuesta de IA que no pertenecen al núcleo estable. Aparecen, desaparecen y son reemplazados semanalmente por otros.
Core / Núcleo designa los pocos dominios que en una respuesta de IA permanecen de forma duradera. Su churn-in es prácticamente del 0%: son citados semana tras semana, independientemente de qué otras fuentes entren y salgan.

Google AI Overviews: el círculo cerrado

Las AI Overviews son la más estable de las tres plataformas. De promedio se citan 11 dominios, de los cuales 8 están presentes de forma permanente. Aunque esto suena en un principio tranquilizador, la estabilidad se distribuye de forma desigual.

En el 53% de todos los prompts no cambia ni una sola fuente a lo largo de 17 semanas. En el 28% se producen cambios ocasionales. Y en el 19% restante las fuentes cambian con la misma regularidad que en AI Mode, con un 46% de churn-in. Las AI Overviews no son uniformemente estables, sino que están divididas entre una mayoría en las que no se mueve nada y una minoría en las que todo rota.

Hemos verificado que no de un error de medición: en el 87% de los prompts estables, el texto de respuesta generado cambia semana tras semana, pero los dominios citados son los mismos. Las AI Overviews escriben frases nuevas cada semana pero recurren a las mismas ocho fuentes. Quien está dentro, se queda. Quien no está, tampoco entra.

Ejemplo: Para „7 trucos para que se coma sus bolitas» las AI Overviews citan exactamente los mismos 11 dominios durante 17 semanas: arquivet.com, barakaldotiendaveterinaria.es, expertoanimal.com y ocho más. Cero movimiento. Para „viaje a una ciudad en navidad», en cambio, el panorama cambia cada semana. Probablemente porque la respuesta a «dónde compro comida para mi mascota» es menos estacional que la pregunta «a dónde ir en Navidad».

Google AI Mode: pocos permanecen, muchos cambian

En el AI Mode el panorama es diferente. Por respuesta se citan entre 14 y 16 dominios, de los cuales el 56% cambia cada semana. Suena dramático, y con razón. Pero vale la pena echarle un vistazo más de cerca: no todos los dominios evolucionan de la misma manera.

El 86,5% de los prompts analizados tienen un núcleo estable de entre 1 y 5 dominios que permanecen presentes durante semanas y meses. El resto de los dominios, en cambio, rotan un 89% cada semana.

Ejemplo: Para „antivirus bueno y gratis» masmovil.es permanece en el Core a lo largo de todo el período. En la 1° semana aparecen junto a él avira.com, dssolucionesdigitales.com, elpais.com y google.com. En la 2° semana tres de ellos han desaparecido y en su lugar llegan avast.com, bitdefender.com, cybernews.com y lasexta.com. masmovil.es permanece, los demás se van intercambiando.

¿Quién forma el Core? YouTube y Amazon suelen estar presentes, lo cual no sorprende a nadie. Más destacable es que en el 83% de los prompts hay al menos también un dominio especializado en el núcleo. No solo ganan las grandes plataformas.

Y todo esto sucede independientemente del país analizado:

Churn-in y Retention - AI Mode

Country	Churn-in / Week	Retention / Week	Domains / Answer
DE	56%	46%	13.5
US	54%	49%	16.1
UK	54%	49%	15.7
IT	59%	43%	13.7
ES	56%	44%	11.8
FR	57%	43%	12.3

Churn-in y Retention no suman el 100% porque tienen bases de referencia diferentes. Churn-in pregunta: ¿Cuántas de las fuentes actuales son nuevas? Mientras que Retention pregunta: ¿Cuántas de las fuentes de la semana pasada siguen estando presentes esta semana? Si una respuesta tenía, por ejemplo, ocho fuentes una semana y doce la siguiente, ambos valores tienen una relación diferente con el número total.

ChatGPT Search: fluctuación total

ChatGPT Search es el caso extremo. El 74% de los dominios son nuevos cada semana. Las estructuras de core estables son poco frecuentes. De hecho, el prompt medio no tiene ningún dominio presente a lo largo de las 17 semanas. En comparación, en el AI Mode la mediana es de aproximadamente 2 dominios de core estables por prompt. En ChatGPT sí existen prompts con fuentes estables pero, son la excepción, no la regla.

Además, ChatGPT cita significativamente menos fuentes. De media solo entre 3 y 4 dominios por respuesta, frente a los 14-16 del AI Mode. Y aquí viene lo interesante: incluso en consultas en español, el 68% de las fuentes del núcleo de ChatGPT son en inglés. Quien consulta ChatGPT en España recibe mayoritariamente respuestas de fuentes en inglés.

Ejemplo: Para „¿a qué precio cotizan los futuros del gas natural?» ChatGPT cita en la 1° semana un total de 5 dominios, entre ellos cantabriaeconomica.com, capital.com y cmegroup.com. En la 2° semana 3 dominios, algunos de ellos diferentes (bloomberg.com, investing.com). Y en la 3° semana, de nuevo cambian parte de los dominios (reuters.com, yahoo.com), bloomberg.com e investing.com permanecen. La respuesta puede sonar plausible cada semana, pero no tiene nada que ver con un uso consistente de las fuentes.

El dominio de marca permanece, el resto rota

Que en una búsqueda de «ikea billy estanterías» acabe citándose ikea.com es poco sorprendente. Lo interesante es con qué consistencia ocurre y qué sucede con las co-citas de su alrededor.

En Google AI Mode, el propio dominio de marca solo está presente todas las 17 semanas en el 43% de las consultas de marca. En la mayoría de los casos, incluso la fuente más obvia se sale en algún momento del conjunto de citaciones. En el 66% permanece al menos el 80% de las semanas. Las consultas de marca varian globalmente un 20% menos que la media (45% vs. 56% de churn-in). Es decir, son notablemente más estables, pero no radicalmente diferentes.

El patrón real se muestra en las co-citas de su alrededor. Los otros 12-15 dominios citados junto a la marca rotan un 70% cada semana. Las marcas fuertes permanecen ancladas, mientras que el espacio a su lado es reasignado semanalmente.

Mapa de calor: evolución de citations de IKEA Billy estanterías a lo largo de 17 semanas - ikea.com citado de forma continua y destacada, otros dominios como youtube.com, focus.de y google.com rotan — El gráfico muestra la visibilidad de ikea.com para el prompt en alemán «ikea billy regal» (ikea billy estantería)

Ejemplo: Para „como vender en stockx» stockx.com aparece 17 de las 17 semanas. En la 1° semana aparecen junto a él google.com, spocket.co, tiktok.com y youtube.com. En la 17° semana son google.com, shopify.com, tiktok.com y youtube.com los que aparecen. Han cambiado todos, por completo. Solo StockX permanece.

Quien quiera saber si su propio dominio pertenece al core o al carrusel puede comprobarlo directamente con SISTRIX Prompt Tracking. Para ello se puede definir a través de Prompt Research un conjunto de prompts relevantes para la propia marca. SISTRIX determina entonces diariamente si la propia marca aparece en las respuestas de los modelos de IA y con qué frecuencia, y qué dominios se utilizan como fuentes.

Tabla de fuentes (URLs) SISTRIX para Costa Coffee: Top URL www.cozymeal.com/magazine/coffee-chains con 11 menciones, seguido de páginas de cafenero.com y costaireland.ie con logos de marcas

Así puedes ver, por ejemplo, si para la propia marca el propio dominio está permanentemente anclado en el conjunto de citaciones o entra y sale cada semana. SISTRIX para IA y chatbots es gratuito para todas las cuentas. Si quieres probarlo puedes crear una cuenta de prueba gratuita.

¿Qué tipos de dominio sobreviven al Citation Drift?

No todos los tipos de página se ven igualmente afectados. Hemos clasificado los dominios citados en categorías y analizado con qué frecuencia logran llegar al núcleo estable de una respuesta.

Google AI Mode: jerarquía clara

Gráfico de barras horizontal: tasa de supervivencia de tipos de dominio en AI Mode - Vídeo/YouTube 24%, Big Tech 16%, Wikipedia 12%, Marketplace 10%, Foros/UGC 3%, Noticias/Medios 1,4%

¿Qué tipos de dominio sobreviven al Citation Drift?

Domain Type	Median Presence	Core Rate
Video (YouTube)	53%	24%
Big Tech (Google, Apple, Microsoft)	41%	16%
Wikipedia	24%	12%
Marketplace (Amazon, Otto, Zalando)	18%	10%
News / Media	12%	1.4%
Forums / UGC (Reddit, Gutefrage)	12%	3%

YouTube es el claro ganador. La plataforma está presente como fuente en más de la mitad de todas las fechas de referencia y, con una tasa core del 24%. Es la que más frecuentemente acaba de forma permanente en el núcleo. Que precisamente la plataforma de vídeos propiedad de Google obtenga tan buenos resultados no debería sorprendernos.

En el otro extremo se encuentran los sitios de noticias con una tasa de core del 1,4%. Los artículos de noticias son en las respuestas de IA un billete de ida. Se citan hoy y una semana después han desaparecido. Para los editores que quieren basar su futuro en GEO, este no es un mensaje fácil de aceptar.

ChatGPT: sin jerarquía clara

En ChatGPT no se aprecia un patrón comparable. Las diferencias entre los tipos de dominio son pequeñas, e incluso los dominios que uno, intuitivamente, esperaría no aparecen de forma sistemática con mayor frecuencia que otros en el núcleo estable. Esto encaja con la descripción de la sección de la plataforma: ChatGPT selecciona de forma amplia para cada respuesta, sin que ninguna categoría en particular domine de forma permanente. Para GEO esto significa que en ChatGPT ningún tipo de página se perfila como objetivo de optimización fiable.

¿Qué sobrevive? La clasificación de URLs

Hemos clasificado más de 2.500 de las URLs citadas mediante un análisis NLP basado en Gemini según idioma, tipo de contenido, modelo de monetización, estado Evergreen y señales E-E-A-T. Esto da como resultado dos perfiles claramente diferenciados para lo que acaba en Core y en Peripheral.

En el Google AI Mode, los dominios de Core son un 80% en alemán (Peripheral: 62%), y el 85% de las URLs de Core son Evergreen (Peripheral: 77%). Las páginas de producto y las tiendas dominan el núcleo, mientras que las guías y las noticias se van alternando. Quien quiera aparecer en el Core del AI Mode en Alemania debería apostar por páginas de producto en alemán y atemporales, no por artículos de revista.

En ChatGPT Search el panorama se invierte. Los dominios de Core tienen una puntuación E-E-A-T de 16/20, los Peripheral solo 14/20 (la diferencia E-E-A-T más notable de todas las plataformas analizadas). El idioma se inclina en sentido contrario: el Core de ChatGPT es un 68% en inglés, incluso en consultas en alemán. La documentación y las fuentes institucionales constituyen el núcleo; las guías editoriales se rotan.

Las dos plataformas recompensan perfiles de contenido prácticamente opuestos. El idioma, el tipo de contenido y el modelo de monetización son características estructurales de un sitio web que no se pueden transformar de la noche a la mañana para GEO. Para algunos sitios, un perfil se ajusta mejor que otros, ambos, y para otros ninguno. La posición que se ocupa depende de la situación de partida, no solo de la optimización.

Cada plataforma cita fuentes diferentes

Incluso los propios productos de Google apenas coinciden. Para el mismo prompt, las AI Overviews y el AI Mode citan dominios diferentes en un 83% de los casos. El índice de Jaccard, que mide la coincidencia, tiene aquí un valor de 0,17. En otras palabras, de todos los dominios que aparecen en una de las dos respuestas, solo el 17% aparece en ambas. Entre el AI Mode y ChatGPT la coincidencia es aún menor, con un valor de 0,125.

Ejemplo: „¿cómo puedo ver la televisión online de forma gratuita?»

AI Mode cita: check24.de, dslweb.de, hoerzu.de (portales de comparación y guías de TV)
ChatGPT cita: arte.tv, zdf.de, 3sat.de (las cadenas directamente)
En común: solo joyn.de

Una de las razones de la baja coincidencia reside en las preferencias estructurales de las plataformas. El AI Mode recurre en un 80% a fuentes en español, ChatGPT en un 68% a fuentes en inglés, incluso en consultas en español. Solo este sesgo lingüístico hace que las fuentes de datos de ambas plataformas apenas puedan solaparse para el mercado castellanohablante.

Para GEO esto significaría que una estrategia que funciona para AI Mode a menudo no alcanza a ChatGPT y viceversa. Las estrategias de las citas específicas por plataforma no son opcionales, sino un requisito fundamental.

Nivel de dominio vs. nivel de URL: los datos son conservadores

Todos los datos de volatilidad mencionados hasta ahora se basan en comparaciones a nivel de dominio. A nivel de URL, es decir, la subpágina concreta y no todo el sitio web, la volatilidad es aún significativamente mayor: un 85% a la semana frente al 74% a nivel de dominio. Incluso cuando un dominio permanece estable en el conjunto de citaciones, Google cambia con frecuencia la subpágina específica.

Ejemplo: imdb.com permanece como fuente para „action adventure movie». En la 1° semana se enlaza /list/ls594655800/, en la 2° semana /chart/moviemeter/. Una página completamente diferente del mismo dominio.

Para GEO, esto significa que posicionar una sola URL en las respuestas de la IA no es un objetivo de medición significativo. La presencia a nivel de dominio es medible y controlable. Pero qué URL concreta de ese dominio aparece en una semana determinada no se puede controlar.

El Citation Drift es global

Gráfico de columnas: Citation Drift de AI Mode por país - Italia 59%, Francia 57%, Alemania 56%, España 56%, EE.UU. y Reino Unido 54% cada uno de churn-in por semana

Las tasas de drift en Google AI Mode son notablemente consistentes en los seis países analizados: entre el 54% y el 59% de churn-in por semana, independientemente del país y del idioma. El Citation Drift no es un fenómeno exclusivo de EE.UU. o de Alemania, sino una característica estructural de la plataforma.

En ChatGPT, en cambio, se aprecian diferencias entre países. Alemania, con un 74%, es notablemente más volátil que el Reino Unido (60%) o Francia (42%). La causa probablemente reside en la diferente cobertura de rastreo para los distintos idiomas.

No se observa ninguna tendencia clara durante las 17 semanas. Ni estabilización ni aplanamiento. Quienes esperan el momento en que las plataformas de IA se pongan de acuerdo sobre un conjunto fijo de fuentes podrían tener que esperar mucho tiempo.

¿Qué significa esto para GEO?

Los hallazgos de este estudio se pueden traducir en tres recomendaciones concretas:

Planificación de contenido: Evergreen antes que noticias, producto antes que guías.
Las tasas de core por tipo de contenido marcan una priorización clara. El contenido Evergreen y las páginas de producto y tienda tienen sistemáticamente mayores probabilidades de ser citadas de forma duradera. Los artículos de noticias, con una tasa de core del 1,4%, son prácticamente inadecuados como objetivo de citación, aunque siguen siendo útiles como formato de tráfico, solo que no como inversión GEO. El vídeo, con una tasa de core del 24%, es el tipo de contenido más potente de todos. Para las empresas que aún no gestionan un canal de YouTube estructurado, merece la pena echarle un segundo vistazo.
Establecer el enfoque de la plataforma en función de la situación inicial.
Las AI Overviews, el AI Mode y ChatGPT citan para la misma pregunta más de un 80% de dominios diferentes. Al mismo tiempo, recompensan perfiles de contenido distintos (páginas de tienda en español en el AI Mode, documentación en inglés en ChatGPT). La mayoría de las empresas están estructuralmente mejor posicionadas para una de las plataformas que para las demás. En lugar de jugar en las tres con el mismo peso, suele ser más sensato elegir la plataforma adecuada como objetivo de optimización y tratar las demás como objetivo de monitorización.
Calibrar las expectativas de GEO.
Las promesas clásicas del SEO como «posición 1 para la palabra clave X» no funcionan en las respuestas de IA. GEO es en definitiva la optimización de las casualidades con las que trabajan los LLMs, y con una volatilidad semanal del 56%, una citación individual no es un rendimiento reproducible, sino una instantánea. En el caso de los proyectos, esto significa centrarse en medir el éxito en función de la presencia a lo largo del tiempo, no de los resultados individuales, y establecer expectativas claras para las partes interesadas: GEO es un proceso continuo, no una optimización puntual con resultado permanente.

Base de datos

Este estudio se basa en el SISTRIX AI Research Index e incluye 82.619 indicaciones cualificadas con 1.548.213 instantáneas. Se han analizado seis países (Alemania, EE.UU., Reino Unido, Italia, España, Francia), tres plataformas (Google AI Mode, Google AI Overviews, ChatGPT Search) y 17 semanas desde el 17 de diciembre de2025 al 08 de abril de 2026 con fechas límite semanales. Además, se han clasificado 2.556 URLs de origen por idioma, tipo de contenido y E-E-A-T.

Todas las métricas de volatilidad se basan en comparaciones a nivel de dominio entre instantáneas semanales consecutivas. Las métricas principales son churn-in (proporción de dominios nuevos por semana) y retention (proporción de dominios que sobreviven).

Limitaciones: Los datos de ChatGPT solo incluyen indicaciones con una atribución de fuente consistente. Las tasas de volatilidad mencionadas son conservadoras; a nivel de URL son un 15% más altas.

Johannes Beus

(Autor)

Publicado: 01.05.2026