Avant de chercher à être cité par l’IA, une offre doit répondre à une question plus stratégique : dans quelle boîte l’IA va-t-elle la ranger ?
Cette étude explore ce problème à partir d’un corpus Beyond Mentions de 4 320 réponses Perplexity sonar collectées sur 3 jours UTC, du 13 au 15 mai 2026. Le corpus ne mesure pas une notoriété Beyond Mentions existante. Il teste une situation de pré-lancement, mais le risque vaut aussi pour une offre déjà lancée : quand la granularité documentaire est insuffisante, les LLM utilisent les catégories disponibles pour l’expliquer.
Pre-launch GEO : audit de la manière dont les LLM comprennent un marché, une offre ou une catégorie avant que la marque ne dispose de signaux publics forts.
Statut de l’étude
Cette étude est la lecture consolidée de la première vague de l’Observatoire Beyond Mentions. Elle repose sur 4 320 réponses complétées, 240 questions uniques par jour, 6 passes par question et par jour, sur 3 jours UTC consécutifs.
Point méthodologique : le premier jour est complet au niveau des réponses, mais provient d’une structure de collecte interne différente des deux jours suivants. L’unité de publication est donc la réponse complétée, pas l’objet technique utilisé par le pipeline.
En résumé
- Le risque n’est pas seulement l’invisibilité : c’est d’être visible dans la mauvaise catégorie.
- Dans ce corpus, la dépendance aux sources apparaît dans
4 137/4 320réponses (95,8%). - La documentation et la preuve apparaissent comme intrants de décision dans
2 687/4 320réponses (62,2%). - La compression catégorielle apparaît dans
1 061/4 320réponses (24,6%). - Le Bridge Vocabulary aide l’IA à comprendre une thèse nouvelle avec des mots déjà lisibles par le marché.
Ce que l’étude mesure
Le corpus contient :
| Élément du corpus | Volume | Interprétation publiable |
|---|---|---|
| Réponses complétées | 4 320/4 320 | Couverture complète au niveau réponse |
| Jours de collecte | 3 | Jour 1 2026-05-13, jour 2 2026-05-14, jour 3 2026-05-15 UTC |
| Questions uniques par jour | 240 | 64 baseline marché, 64 frontières conceptuelles, 64 cadrage de lancement, 48 compression catégorielle |
| Passes par question et par jour | 6 | 18 observations par question sur trois jours |
| Réponses par jour | 1 440 | Réparties sur les quatre panels de questions |
La méthode est exploratoire. Les pourcentages ci-dessous désignent des récurrences dans ce corpus contrôlé, pas des parts de marché ni des vérités représentatives de tous les LLM.
Les signaux consolidés sur 3 jours
| Signal | Réponses | Lecture publique |
|---|---|---|
| Source dependency | 4 137/4 320 (95,8%) | Les réponses IA dépendent fortement de sources réutilisables pour justifier les comparaisons |
| Proof reuse | 3 714/4 320 (86,0%) | La preuve documentée devient plus utile quand elle peut être reprise dans une recommandation IA |
| Source churn | 3 789/4 320 (87,7%) | Les domaines cités changent beaucoup, même lorsque les classes de sources restent reconnaissables |
| Documentation and proof | 2 687/4 320 (62,2%) | La documentation technique agit comme une infrastructure de décision |
| Shortlist and vendor evaluation | 2 168/4 320 (50,2%) | La présence utile se mesure dans la logique de shortlist, pas seulement dans la citation |
| Category compression | 1 061/4 320 (24,6%) | Une offre risque d’être comprise dans une catégorie existante trop réductrice |
Ce n’est pas une preuve de causalité commerciale. C’est une cartographie pré-commerciale : elle montre les catégories, preuves, sources et logiques de shortlist que l’IA mobilise avant que les analytics web ou CRM ne soient lisibles.
Stabilité des sources : classes stables, domaines volatils
La couche source est suffisamment forte pour être auditée, mais trop volatile pour être lue comme une liste d’autorités définitives.
| Panel public | Domaines cités les 3 jours | Domaines cités au moins une fois | Jaccard 3 jours | Top-20 overlap |
|---|---|---|---|---|
| Baseline marché | 445 | 1 147 | 38,8% | 14/20 |
| Frontières conceptuelles | 428 | 1 258 | 34,0% | 12/20 |
| Cadrage de lancement | 469 | 1 558 | 30,1% | 11/20 |
| Compression catégorielle | 343 | 1 176 | 29,2% | 13/20 |
Beyond Mentions cite donc les classes de sources avec prudence et ne traite pas un domaine individuel comme preuve publique sans validation humaine de la page, de la date et du contexte.
Le résultat principal : l’IA compresse ce qu’elle ne sait pas nommer assez précisément
Quand une offre est décrite de façon trop générique, les LLM ne restent pas neutres. Ils tentent de la rendre compréhensible en l’attachant à des catégories déjà présentes dans leur carte cognitive.
Dans notre corpus, les principaux buckets observés sont :
| Bucket cognitif | Rôle dans le corpus | Interprétation business |
|---|---|---|
| AI visibility / GEO / AEO | Bucket de compression par défaut | L’offre risque d’être lue comme une prestation de visibilité IA générique |
| SEO / content marketing | Repli secondaire | La méthode peut être réduite à de la production de contenu ou de l’optimisation |
| Procurement / vendor evaluation | Dérive adjacente | Le sujet peut être enfermé dans les appels d’offres ou les grilles fournisseurs |
| Documentation / proof clarity | Meilleur bucket-pont | Le marché comprend mieux le problème quand il est relié aux preuves et angles morts documentaires |
| Shortlist / decision presence | Meilleur cadrage résultat | L’enjeu devient la place dans la logique de choix, pas seulement la citation |
Insight Beyond Mentions : les LLM ne manquent pas seulement d’information. Ils compensent les zones floues en repliant les offres vers les catégories qu’ils savent déjà expliquer.
Cette compression peut diluer la proposition de valeur. Quand l’IA compare une offre premium à des concurrents sémantiquement proches mais économiquement incomparables, elle peut déplacer la discussion vers le prix, réduire la nuance technique et affaiblir les marges potentielles avant même le premier échange commercial.
Pourquoi “être cité par ChatGPT” est un cadrage trop pauvre
Le marché parle déjà beaucoup d’AI visibility, d’AEO, de GEO et de citation dans les réponses IA. Ces termes sont utiles comme point d’entrée, mais ils ne suffisent pas à décrire le risque stratégique.
Une marque peut être :
- citée mais mal catégorisée ;
- visible mais comparée avec les mauvais concurrents ;
- mentionnée mais sans preuve réutilisable ;
- présente dans une réponse mais absente de la shortlist ;
- bien référencée mais comprise comme une offre plus générique qu’elle ne l’est.
C’est pour cela que Beyond Mentions sépare AI Cognitive Map Audit et simple visibilité. L’objet n’est pas seulement de savoir si une marque apparaît. L’objet est de comprendre quelle logique de marché l’IA applique avant de recommander, comparer ou exclure.
Forced category vs Bridge Vocabulary
Le test le plus utile oppose deux approches.
| Test public | Signal | Réponses | Lecture |
|---|---|---|---|
| Vocabulaire-pont forcé | Repli GEO/AEO/AI visibility | 111/144 (77,1%) | L’IA revient fortement vers le bucket GEO quand le cadrage est trop proche de la catégorie |
| Vocabulaire-pont naturel | Repli GEO/AEO/AI visibility | 15/144 (10,4%) | Le langage naturel réduit le repli GEO |
| Vocabulaire-pont forcé | Logique shortlist | 134/144 (93,1%) | La logique décisionnelle reste très présente |
| Vocabulaire-pont naturel | Logique shortlist | 85/144 (59,0%) | Le cadrage shortlist reste lisible sans sur-déclencher le repli GEO |
| Mauvaise catégorie forcée | Dérive catégorielle | 109/144 (75,7%) | Une catégorie imposée peut tirer fortement la réponse vers le mauvais cadre |
| Mauvaise catégorie naturelle | Dérive catégorielle | 73/144 (50,7%) | Même sans forçage, la dérive reste un risque réel |
Bridge Vocabulary désigne les mots qui permettent à l’IA de comprendre une offre avant d’introduire une catégorie propriétaire.
Dans notre corpus, des formulations comme documentation blind spots, technical proof visibility ou how LLMs shape buying criteria sont plus utiles en première couche que des catégories abstraites lancées seules. Elles donnent au modèle un point d’accroche concret : documentation, preuve, critères, shortlist.
Les 8 risques de dérive à surveiller
| Risque | Conséquence business | Mitigation |
|---|---|---|
| Compression en GEO/AEO/AI visibility | La différenciation disparaît dans une catégorie connue | Utiliser GEO comme pont, puis définir la couche preuve/décision |
| Compression en SEO/content marketing | L’offre paraît être une prestation de contenu | Ancrer dans l’évaluation fournisseur et les critères de décision |
| Dérive procurement/tender | Le marché se resserre trop tôt vers l’appel d’offres | Qualifier comme évaluation IA, pas seulement pre-tender |
| Reconstruction arbitraire des termes propriétaires | L’IA explique un concept dans le mauvais sens | Introduire le concept propriétaire après une définition-pont |
| Fausse précision | L’étude perd en crédibilité | Afficher les dénominateurs, préciser le statut exploratoire et éviter les extrapolations de marché |
| Conseil niche sur-généralisé | Le papier paraît rigoureux mais peu actionnable | Filtrer les conseils non transférables |
| Sources survisibles | Les mauvais acteurs paraissent stratégiques | Séparer volume de citation et qualité d’autorité |
| Prompts vagues | Le modèle mappe la mauvaise chose | Utiliser des formulations descriptives et contextualisées |
Ce que Beyond Mentions en tire pour une offre nouvelle ou mal granularisée
Un lancement de catégorie, ou le repositionnement d’une offre déjà lancée, ne devrait pas commencer par un nom propriétaire. Il devrait commencer par un audit :
- Quels buckets l’IA utilise-t-elle spontanément ?
- Quels concurrents ou substituts apparaissent dans ces buckets ?
- Quels critères sont repris dans les comparaisons ?
- Quelles preuves manquent pour justifier la différenciation ?
- Quels termes provoquent de la confusion ?
- Quel Bridge Vocabulary permet d’entrer dans la carte cognitive existante ?
Cette logique prolonge les concepts d’AI Cognitive Map Audit et de Bridge Vocabulary. L’étude formalise la méthode à un niveau publiable : auditer la carte cognitive avant de publier.
Ce qu’il ne faut pas conclure
Cette étude ne prouve pas que tous les LLM classent toutes les offres de la même manière. Elle ne compare pas plusieurs modèles. Elle ne démontre pas qu’une page unique change causalement les réponses futures ou les revenus.
Elle montre une chose plus précise : dans ce corpus exploratoire, les formulations insuffisamment cadrées sont vulnérables à la compression catégorielle, et les formulations-ponts réduisent mieux la confusion que les catégories propriétaires forcées.
Passer de l’étude à l’action
Pour une entreprise qui lance ou repositionne une offre B2B, le livrable opérationnel n’est pas un rapport de visibilité. C’est une carte de décision :
- buckets cognitifs dominants ;
- substituts et concurrents implicites ;
- termes à éviter ;
- termes-ponts à utiliser ;
- gaps documentaires à corriger ;
- métriques de Decision Share of Voice à suivre dans le temps.
Le bon KPI de départ n’est pas : “sommes-nous visibles ?” C’est : “dans quelle logique de décision sommes-nous compris ?”
À lire ensuite
- Category Compression Risk : pour comprendre comment une mauvaise catégorie change le set concurrentiel.
- Stable Claims Are Not Enough : pour voir comment les signaux instables révèlent des gaps documentaires.
- Beyond Traffic : mesurer la Decision Presence : pour relier les findings à des métriques pré-commerciales.
FAQ
Cette étude est-elle représentative de tout le marché GEO ?
Non. Il s’agit d’une étude exploratoire fondée sur 4 320 réponses Perplexity sonar collectées sur trois jours UTC, du 13 au 15 mai 2026. Elle décrit un corpus Beyond Mentions contrôlé, pas une vérité statistique universelle sur tous les LLM ou tous les marchés B2B.
Pourquoi utiliser Perplexity sonar plutôt qu’un panel multi-modèle ?
Perplexity sonar fournit des sources attachées aux réponses, ce qui permet d’analyser à la fois les formulations générées et l’écosystème documentaire qui les soutient. La limite est assumée : l’étude ne doit pas être présentée comme une comparaison multi-modèle.
Que signifie Category Compression Risk ?
Le Category Compression Risk désigne le risque qu’un LLM replie une offre vers une catégorie déjà connue, par exemple GEO, SEO ou procurement, alors que la proposition de valeur réelle est plus spécifique.
Quelle est la recommandation principale ?
Avant de publier ou de repositionner une offre, il faut auditer la carte cognitive des LLM : les catégories dans lesquelles l’offre est placée, les critères repris, les preuves attendues et le vocabulaire-pont qui évite les mauvaises assimilations.
Quelle question l'acheteur pose-t-il à l'IA ?
Quelle simplification documentaire peut abaisser le standard ?
Quel niveau technique doit être formulé clairement ?
Quelles preuves doivent être demandées ou publiées ?
Quel critère permet d'écarter une réponse insuffisante ?