Études · Retrieval vs Citation

Pourquoi les IA citent souvent vos pages les moins visibles en SEO ?

Enquête sur trois verticales indépendantes (santé YMYL, artisanat/BTP, droit du travail) : les pages qui dominent les citations IA ne sont pas celles qui dominent les SERP. Modèle Retrieval ≠ Citation, Intent Match et métrique Citation Efficiency.

Tout est parti d’une anomalie. Un de nos sites dominait la recherche sur une requête, parmi les meilleures impressions du domaine, et pourtant les assistants génératifs ne semblaient jamais le citer sur cette question. Premier dans les SERP, absent de ChatGPT. Nous avons d’abord cru à un cas isolé, un caprice de modèle. Puis nous avons cherché le même signal ailleurs, et nous l’avons retrouvé sur deux autres verticales sans aucun rapport.

Pendant des années, les SEO ont supposé qu’une page visible était une page influente. Premier sur Google revenait à être la référence sur le sujet. Avec ChatGPT, Perplexity ou Copilot, cette équation se fissure.

Nous avons analysé trois sites appartenant à trois verticales différentes : la santé, l’artisanat et le BTP, le droit du travail. Les mêmes signaux apparaissent dans les trois cas. Les données sont anonymisées, mais issues de relevés réels sur trois sites distincts. Elles permettent d’identifier les mécanismes qui semblent favoriser la citation par les moteurs génératifs. Voici les données et les conclusions que nous en avons tirées.

La page qui domine les citations IA n’est pas forcément celle qui domine les SERP.

C’est une enquête sur un pattern observé dans trois verticales indépendantes, pas une recette.

Ce que montrent trois verticales indépendantes

Les pages qui gagnent les citations IA ne sont pas nécessairement les plus visibles. Elles sont souvent celles qui répondent le plus directement à une question conversationnelle.

La thèse en trois lignes

  • Le SEO maximise la probabilité d’être récupéré.
  • Les IA maximisent la probabilité de trouver la meilleure réponse.
  • Ces deux objectifs produisent parfois des gagnants différents.

Retrieval ≠ Citation : le fait d’être récupéré comme page candidate par un moteur de recherche ne garantit pas d’être cité dans une réponse générée par l’IA. Ce sont deux sélections différentes, avec des critères différents.

En résumé

  • Sur trois verticales indépendantes, la page la plus visible dans la recherche n’est pas la plus citée par l’IA.
  • Les hubs gagnent souvent le retrieval. Les pages-réponses gagnent souvent la citation.
  • L’Intent Match, la correspondance directe à une question, explique probablement davantage de variance que la distinction hub contre spoke.
  • Nous proposons une métrique exploratoire, la Citation Efficiency (citations IA ÷ impressions SERP), utile surtout pour comparer des pages similaires. Ce n’est pas un standard du secteur.
  • Citation et recommandation restent deux marches différentes : être cité n’est pas être recommandé avec les bons critères.

Note méthodologique

Les impressions et les citations IA proviennent toutes deux de Bing Webmaster Tools, les secondes via son rapport natif AI performance, par page et sur la même fenêtre d’observation. Ce sont des relevés exploratoires propres à ces sites, pas un échantillon représentatif de tous les moteurs.

Verticale A : Santé (YMYL)

Le phénomène n’apparaît pas dans un laboratoire. Il apparaît sur un vrai site, sur une thématique YMYL où la qualité de réponse compte particulièrement.

Visibilité SERP

Type de pageImpressions
Hub principal204
Guide secondaire140
Sous-thématique A77
Page-réponse A43
Sous-thématique B25
Sous-thématique C21
Page-réponse B19

Citations IA

Type de pageCitations
Page-réponse A62
Guide secondaire50
Sous-thématique A43
Page-réponse B29
Hub principal18

Citation Efficiency (citations ÷ impressions)

Type de pageCitationsImpressionsEfficiency
Page-réponse B29191,53
Page-réponse A62431,44
Sous-thématique A43770,56
Guide secondaire501400,36
Hub principal182040,09

En plaçant les impressions en abscisse et les citations en ordonnée, le paradoxe saute aux yeux : les pages les moins visibles montent, la plus visible reste en bas à droite.

Citations IA
 70 ┤
 60 ┤    ● Page-réponse A
 50 ┤                              ● Guide secondaire
 40 ┤         ● Sous-thématique A
 30 ┤  ● Page-réponse B
 20 ┤                                        ● Hub principal
 10 ┤
  0 ┼────┬────┬────┬────┬────┬────┬────┬────
     0   30   60   90  120  150  180  210
                                  Impressions SERP

Les pages qui répondent à une situation ou une question précise capturent une part disproportionnée des citations.

Pourquoi nous avons cherché un deuxième, puis un troisième site

Un résultat sur un seul site ne prouve rien. Il pouvait s’agir d’un artefact : un thème particulier, une structure de pages propre à ce site, un hasard de période. Pour le savoir, il fallait reproduire l’observation ailleurs, sur des sites sans rapport. Nous avons donc répété exactement le même relevé, impressions SERP contre citations IA, sur une deuxième verticale, puis sur une troisième.

Verticale B : Artisanat et rentabilité

Le même phénomène réapparaît dans une industrie totalement différente.

Visibilité SERP

Type de pageImpressions
Hub principal402
Sous-thématique A66
Sous-thématique B42
Page-métier A35
Outil A20
Sous-thématique C16
Sous-thématique D16
Page-métier B10
Page-réponse A9
Page-métier C6

Citations IA

Type de pageCitations
Hub principal172
Page-métier C57
Page-métier A39
Page-réponse A31
Sous-thématique B19
Page-métier B14
Outil B12

Citation Efficiency (citations ÷ impressions)

Type de pageEfficiency
Page-métier C9,50
Outil B4,00
Page-réponse A3,44
Page-métier B1,40
Page-métier A1,11
Hub principal0,43

Le chiffre le plus spectaculaire

Une page métier obtenant seulement 6 impressions SERP génère 57 citations IA, soit une Citation Efficiency de 9,5. Tout aussi puissant que l’exemple santé, et impossible à exploiter pour un concurrent.

Un ratio supérieur à 1 peut surprendre : comment une page peut-elle être plus citée que vue ? Parce que les deux chiffres ne se mesurent pas sur la même surface. Les impressions viennent des SERP classiques, alors que les assistants génératifs peuvent puiser dans leur propre index ou dans des bases de crawl, sans générer d’impression dans Bing ou Google. Une page peu visible en recherche peut donc être largement reprise en réponse.

Nuance honnête : ici, la page la plus citée en volume brut est le hub, par sa visibilité massive. Mais ce sont les pages-réponses qui dominent largement en efficacité. Le pattern ne dit pas qu’elles gagnent toujours en volume, il dit qu’elles capturent une part de citations disproportionnée par rapport à leur visibilité.

Verticale C : Droit du travail et risques psychosociaux

Une troisième verticale, sans rapport avec les deux premières, montre le même signal.

Visibilité SERP

Type de pageImpressions
Étude statistique128
Situation sociale A96
Situation sociale B75
Signal faible A52
Outil de calcul42

Citations IA

Type de pageCitations
Outil de calcul73
Étude statistique73
Signal faible A34
Guide recours30
Page preuve28

Citation Efficiency

Type de pageCitationsImpressionsEfficiency
Outil de calcul73421,74
Signal faible A34520,65
Étude statistique731280,57

Le signal

Une page de calcul obtient près de deux fois plus de citations que d’impressions, là où l’étude statistique, bien plus visible, plafonne sous 0,6.

Pourquoi le troisième site change tout

Un constat sur un seul site est une anecdote. Sur deux, une hypothèse. Sur trois verticales sans rapport, un pattern plausible.

Nombre de sitesStatut du constat
1 siteAnecdote, possible artefact
2 sitesHypothèse à confirmer
3 verticales indépendantesPattern plausible, à tester plus largement

C’est précisément la troisième verticale qui a changé notre lecture. Tant que le phénomène n’apparaissait qu’en santé puis en BTP, nous pouvions soupçonner un biais commun : un style de rédaction, une façon de structurer les pages, un même outillage. Le droit du travail, sans rapport éditorial ni technique avec les deux autres, a écarté cette explication. Le signal semblait moins lié aux sites eux-mêmes qu’à la façon dont les moteurs sélectionnent certaines réponses.

Pourquoi l’Intent Match explique mieux les citations que le SEO classique

Précaution méthodologique. Ce qui suit est une hypothèse de modèle, pas une vérité absolue. Les pipelines internes de ChatGPT, Google ou Bing varient, changent souvent et ne sont pas publics. Le modèle est gardé parce qu’il prédit bien ce qu’on observe dans les trois verticales.

Retrieval

Intent Match

Citation

Intent Match : capacité d’une page à correspondre exactement à la formulation naturelle d’une question utilisateur.

Le SEO répond à : « Peut-on trouver cette page ? »

L’Intent Match répond à : « Est-ce la réponse que l’on cherchait ? »

Le SEO classique optimise surtout le retrieval : autorité, indexation, couverture. Il maximise la probabilité d’entrer dans le pool de candidats. Mais une fois ce pool constitué, le moteur génératif ne reprend pas la page la plus autoritaire, il reprend celle qui ressemble le plus à la question posée. C’est l’Intent Match qui départage, et c’est lui qui explique le mieux nos écarts entre visibilité et citation.

Le retrieval récupère plusieurs candidats. L’Intent Match sélectionne souvent celui qui ressemble déjà à la question.

Question typePage sélectionnée
Pourquoi mon symptôme persiste ?Page-réponse
Combien gagne un professionnel indépendant ?Page-réponse
Quel montant puis-je obtenir ?Page-réponse

Dans les trois cas, le système n’a pas besoin d’extraire la bonne portion au milieu d’un guide. La page ressemble déjà à la question, donc elle est plus facile à reprendre.

Le vrai pattern : les pages-réponses

Ce que les pages à plus forte Citation Efficiency ont en commun n’est pas leur sujet, pas leur secteur, pas leur volume de trafic. C’est leur capacité à répondre immédiatement à une question.

VerticalePage gagnante
SantéRéponse à un symptôme
Artisanat / BTPRéponse à une question métier
Droit du travailRéponse à une question de recours

Les pages à plus forte Citation Efficiency ressemblent davantage à des réponses qu’à des contenus.

Page-réponse : page spécialisée qui répond immédiatement à une question, une situation ou une décision précise, sans dilution thématique.

Hubs et spokes : un mécanisme secondaire

La distinction hub contre spoke garde une valeur explicative, mais elle est secondaire.

RôleÉtape souvent gagnée
HubPage large, forte couverture, forte visibilitéRetrieval
SpokePage spécialisée, réponse directeCitation

Hub vs Spoke explique une partie du phénomène. L’Intent Match en explique probablement davantage : une page spécialisée mal alignée sur une question reste peu citée, tandis qu’une page, même rattachée à un hub, qui épouse exactement une question gagne la citation. Le hub n’est pas l’ennemi du spoke, il capte la visibilité et nourrit les pages-réponses.

Le concept de Citation Efficiency

Citation Efficiency : rapport entre les citations IA d’une page et ses impressions SERP. Elle ne mesure ni la qualité SEO, ni le trafic, mais la capacité d’une page à transformer sa visibilité en citations.

Citation Efficiency = Citations IA ÷ Impressions SERP
VerticaleMeilleure Citation Efficiency
Santé1,53
Artisanat / BTP9,50
Droit du travail1,74

Même lorsque les chiffres varient fortement, de 1,53 à 9,50, les pages à forte Citation Efficiency sont systématiquement des pages à forte valeur de réponse.

Limites de la Citation Efficiency

C’est un indicateur de comparaison, pas une vérité absolue. Le ratio :

  • dépend de l’échantillon : sur de petits nombres, il devient instable et trompeur ;
  • dépend de la période d’observation ;
  • dépend du moteur mesuré ;
  • sert surtout à comparer des pages similaires.

À utiliser sur des volumes suffisants, sur une fenêtre stable, et en segmentant les types de pages.

Comment identifier vos futurs gagnants en Citation Efficiency

Une page a un fort potentiel de citation si :

  • elle cible une profession, un symptôme ou une situation ;
  • elle cible une question ou un problème précis ;
  • elle contient chiffres et seuils ;
  • elle possède un titre proche du langage naturel.

À l’inverse, une page très visible mais peu citée est souvent un hub déguisé, à découper en pages-réponses.

Comment mesurer sa visibilité dans les IA

Il n’existe pas encore d’équivalent de la Search Console pour ChatGPT. La mesure se construit en croisant plusieurs sources, chacune ne couvrant qu’un angle.

SourceCe qu’elle révèleLimite
Bing Webmaster ToolsImpressions, requêtes et citations IA via le rapport AI performanceCouverture centrée sur l’écosystème Bing et Copilot
Google Search ConsoleImpressions, requêtes, apparition dans les AI OverviewsVisibilité IA encore partielle
GA4Trafic de référence depuis les assistants IANe capte que les clics, pas les citations sans clic
Logs serveurPassages des crawlers IA : GPTBot, OAI-SearchBot, PerplexityBot, ClaudeBot, Google-ExtendedIndique la collecte, pas la citation
Outils dédiésSuivi des citations : Profound, Peec AI, Scrunch AICouverture et moteurs variables

Comme le ratio dépend de la période et du moteur, une mesure isolée vaut peu. La visibilité IA bouge : un changement de modèle ou d’index peut déplacer vos citations d’un mois sur l’autre. Le bon réflexe n’est pas un audit unique, mais un monitoring de la Citation Efficiency dans le temps.

Ce que les trois verticales ont en commun

VerticaleGagnant SERPGagnant en Citation EfficiencySignal
SantéHub principalPage-réponseRéponse à un symptôme
Artisanat / BTPHub principalPage-métierRéponse à une question métier
Droit du travailÉtude statistiqueOutil de calculRéponse décisionnelle

Dans ce tableau, le gagnant en Citation Efficiency désigne la page qui capte le plus de citations rapportées à sa visibilité. Malgré des sujets radicalement différents, ces pages appartiennent toutes à la même famille : les pages-réponses.

Ce que nous observons, ce que nous n’affirmons pas

Ce que nous observons. Les pages les plus citées répondent à une question, à une décision ou à une situation.

Ce que nous n’affirmons pas. Nous ne prouvons pas le fonctionnement interne de ChatGPT, de Bing ou de Google. Nous montrons simplement qu’un même signal apparaît dans trois verticales différentes.

Aller plus loin : citation n’est pas recommandation

La Citation Efficiency mesure une marche, pas la course entière. Être cité ne veut pas dire être recommandé. Il est utile de lire ces signaux comme une échelle à trois seuils.

SeuilQuestionMétrique
RetrievalSommes-nous récupérés dans le pool candidat ?Impressions, indexation, autorité
CitationSommes-nous repris dans la réponse ?Citation Efficiency
RecommandationSommes-nous recommandés avec les bons critères ?Decision Share of Voice

Pour un site éditeur, l’enjeu s’arrête souvent à la citation et au trafic qu’elle ramène. Pour une marque qui vend une offre, gagner la citation sans gagner la recommandation peut suffire à apparaître sans convertir. C’est le sujet de Pourquoi je suis cité par ChatGPT mais je ne vends pas ?.

Conclusion

Ce qui ressemblait à une anomalie sur un seul site s’est révélé être un signal stable. Les trois verticales analysées montrent le même phénomène : les moteurs génératifs ne semblent pas privilégier uniquement les pages les plus visibles. Ils semblent privilégier les pages qui correspondent le mieux à une question formulée par un utilisateur.

Le SEO reste indispensable pour entrer dans le pool candidat. Mais une fois récupérée, une page doit encore gagner l’Intent Match, puis la citation.

Le SEO vous rend trouvable. L’Intent Match vous rend citable.

Dans un environnement où les moteurs génératifs deviennent une couche d’accès à l’information, la question n’est plus seulement « puis-je être trouvé ? », mais « suis-je la réponse la plus facile à reprendre ? ».

Sources et outils cités

FAQ

Le phénomène est-il limité à un secteur ?

Non. Nous l'observons sur trois verticales indépendantes : santé YMYL, artisanat et BTP, droit du travail. Dans les trois cas, les pages qui répondent à une question précise capturent une part de citations disproportionnée par rapport à leur visibilité SERP.

Le GEO remplace-t-il le SEO ?

Non. Le SEO rend trouvable, ce qui reste une condition d'entrée dans le pool candidat. Le GEO ajoute une question : une fois récupérée, votre page gagne-t-elle l'Intent Match puis la citation ?

Les backlinks comptent-ils encore ?

Oui pour l'autorité et le retrieval. Mais un fort profil de liens ne garantit pas la citation si la page ne contient pas de bloc de réponse autonome aligné sur une question.

Comment savoir si ChatGPT me cite ?

En croisant Bing Webmaster Tools, Google Search Console, GA4, les logs serveur des crawlers IA et des outils de suivi de citations, puis en comparant citations et impressions pour calculer une Citation Efficiency par page.

Qu'est-ce qui explique le mieux la citation ?

Dans nos observations, l'Intent Match, c'est-à-dire la correspondance directe entre la page et la formulation naturelle d'une question, explique davantage de variance que la simple distinction hub contre page spécialisée.

Question acheteur

Quelle question l'acheteur pose-t-il à l'IA ?

Risque documentaire

Quelle simplification documentaire peut abaisser le standard ?

Standard à imposer

Quel niveau technique doit être formulé clairement ?

Preuve attendue

Quelles preuves doivent être demandées ou publiées ?

Critère de rejet

Quel critère permet d'écarter une réponse insuffisante ?

Mesurez comment l'IA comprend déjà votre marché.

Un diagnostic court permet d'identifier les compressions de catégorie, gaps documentaires et critères qui influencent la décision.