Études · Étude exploratoire

GEO pré-lancement : comment les LLM compressent les catégories B2B

Étude exploratoire Beyond Mentions sur 4 320 réponses Perplexity sonar : le risque n’est pas seulement d’être invisible, mais d’être compris dans la mauvaise catégorie.

Avant de chercher à être cité par l’IA, une offre doit répondre à une question plus stratégique : dans quelle boîte l’IA va-t-elle la ranger ?

Cette étude explore ce problème à partir d’un corpus Beyond Mentions de 4 320 réponses Perplexity sonar collectées sur 3 jours UTC, du 13 au 15 mai 2026. Le corpus ne mesure pas une notoriété Beyond Mentions existante. Il teste une situation de pré-lancement, mais le risque vaut aussi pour une offre déjà lancée : quand la granularité documentaire est insuffisante, les LLM utilisent les catégories disponibles pour l’expliquer.

Pre-launch GEO : audit de la manière dont les LLM comprennent un marché, une offre ou une catégorie avant que la marque ne dispose de signaux publics forts.

Statut de l’étude

Cette étude est la lecture consolidée de la première vague de l’Observatoire Beyond Mentions. Elle repose sur 4 320 réponses complétées, 240 questions uniques par jour, 6 passes par question et par jour, sur 3 jours UTC consécutifs.

Point méthodologique : le premier jour est complet au niveau des réponses, mais provient d’une structure de collecte interne différente des deux jours suivants. L’unité de publication est donc la réponse complétée, pas l’objet technique utilisé par le pipeline.

En résumé

  • Le risque n’est pas seulement l’invisibilité : c’est d’être visible dans la mauvaise catégorie.
  • Dans ce corpus, la dépendance aux sources apparaît dans 4 137/4 320 réponses (95,8%).
  • La documentation et la preuve apparaissent comme intrants de décision dans 2 687/4 320 réponses (62,2%).
  • La compression catégorielle apparaît dans 1 061/4 320 réponses (24,6%).
  • Le Bridge Vocabulary aide l’IA à comprendre une thèse nouvelle avec des mots déjà lisibles par le marché.

Ce que l’étude mesure

Le corpus contient :

Élément du corpusVolumeInterprétation publiable
Réponses complétées4 320/4 320Couverture complète au niveau réponse
Jours de collecte3Jour 1 2026-05-13, jour 2 2026-05-14, jour 3 2026-05-15 UTC
Questions uniques par jour24064 baseline marché, 64 frontières conceptuelles, 64 cadrage de lancement, 48 compression catégorielle
Passes par question et par jour618 observations par question sur trois jours
Réponses par jour1 440Réparties sur les quatre panels de questions

La méthode est exploratoire. Les pourcentages ci-dessous désignent des récurrences dans ce corpus contrôlé, pas des parts de marché ni des vérités représentatives de tous les LLM.

Les signaux consolidés sur 3 jours

SignalRéponsesLecture publique
Source dependency4 137/4 320 (95,8%)Les réponses IA dépendent fortement de sources réutilisables pour justifier les comparaisons
Proof reuse3 714/4 320 (86,0%)La preuve documentée devient plus utile quand elle peut être reprise dans une recommandation IA
Source churn3 789/4 320 (87,7%)Les domaines cités changent beaucoup, même lorsque les classes de sources restent reconnaissables
Documentation and proof2 687/4 320 (62,2%)La documentation technique agit comme une infrastructure de décision
Shortlist and vendor evaluation2 168/4 320 (50,2%)La présence utile se mesure dans la logique de shortlist, pas seulement dans la citation
Category compression1 061/4 320 (24,6%)Une offre risque d’être comprise dans une catégorie existante trop réductrice

Ce n’est pas une preuve de causalité commerciale. C’est une cartographie pré-commerciale : elle montre les catégories, preuves, sources et logiques de shortlist que l’IA mobilise avant que les analytics web ou CRM ne soient lisibles.

Stabilité des sources : classes stables, domaines volatils

La couche source est suffisamment forte pour être auditée, mais trop volatile pour être lue comme une liste d’autorités définitives.

Panel publicDomaines cités les 3 joursDomaines cités au moins une foisJaccard 3 joursTop-20 overlap
Baseline marché4451 14738,8%14/20
Frontières conceptuelles4281 25834,0%12/20
Cadrage de lancement4691 55830,1%11/20
Compression catégorielle3431 17629,2%13/20

Beyond Mentions cite donc les classes de sources avec prudence et ne traite pas un domaine individuel comme preuve publique sans validation humaine de la page, de la date et du contexte.

Le résultat principal : l’IA compresse ce qu’elle ne sait pas nommer assez précisément

Quand une offre est décrite de façon trop générique, les LLM ne restent pas neutres. Ils tentent de la rendre compréhensible en l’attachant à des catégories déjà présentes dans leur carte cognitive.

Dans notre corpus, les principaux buckets observés sont :

Bucket cognitifRôle dans le corpusInterprétation business
AI visibility / GEO / AEOBucket de compression par défautL’offre risque d’être lue comme une prestation de visibilité IA générique
SEO / content marketingRepli secondaireLa méthode peut être réduite à de la production de contenu ou de l’optimisation
Procurement / vendor evaluationDérive adjacenteLe sujet peut être enfermé dans les appels d’offres ou les grilles fournisseurs
Documentation / proof clarityMeilleur bucket-pontLe marché comprend mieux le problème quand il est relié aux preuves et angles morts documentaires
Shortlist / decision presenceMeilleur cadrage résultatL’enjeu devient la place dans la logique de choix, pas seulement la citation

Insight Beyond Mentions : les LLM ne manquent pas seulement d’information. Ils compensent les zones floues en repliant les offres vers les catégories qu’ils savent déjà expliquer.

Cette compression peut diluer la proposition de valeur. Quand l’IA compare une offre premium à des concurrents sémantiquement proches mais économiquement incomparables, elle peut déplacer la discussion vers le prix, réduire la nuance technique et affaiblir les marges potentielles avant même le premier échange commercial.

Pourquoi “être cité par ChatGPT” est un cadrage trop pauvre

Le marché parle déjà beaucoup d’AI visibility, d’AEO, de GEO et de citation dans les réponses IA. Ces termes sont utiles comme point d’entrée, mais ils ne suffisent pas à décrire le risque stratégique.

Une marque peut être :

  • citée mais mal catégorisée ;
  • visible mais comparée avec les mauvais concurrents ;
  • mentionnée mais sans preuve réutilisable ;
  • présente dans une réponse mais absente de la shortlist ;
  • bien référencée mais comprise comme une offre plus générique qu’elle ne l’est.

C’est pour cela que Beyond Mentions sépare AI Cognitive Map Audit et simple visibilité. L’objet n’est pas seulement de savoir si une marque apparaît. L’objet est de comprendre quelle logique de marché l’IA applique avant de recommander, comparer ou exclure.

Forced category vs Bridge Vocabulary

Le test le plus utile oppose deux approches.

Test publicSignalRéponsesLecture
Vocabulaire-pont forcéRepli GEO/AEO/AI visibility111/144 (77,1%)L’IA revient fortement vers le bucket GEO quand le cadrage est trop proche de la catégorie
Vocabulaire-pont naturelRepli GEO/AEO/AI visibility15/144 (10,4%)Le langage naturel réduit le repli GEO
Vocabulaire-pont forcéLogique shortlist134/144 (93,1%)La logique décisionnelle reste très présente
Vocabulaire-pont naturelLogique shortlist85/144 (59,0%)Le cadrage shortlist reste lisible sans sur-déclencher le repli GEO
Mauvaise catégorie forcéeDérive catégorielle109/144 (75,7%)Une catégorie imposée peut tirer fortement la réponse vers le mauvais cadre
Mauvaise catégorie naturelleDérive catégorielle73/144 (50,7%)Même sans forçage, la dérive reste un risque réel

Bridge Vocabulary désigne les mots qui permettent à l’IA de comprendre une offre avant d’introduire une catégorie propriétaire.

Dans notre corpus, des formulations comme documentation blind spots, technical proof visibility ou how LLMs shape buying criteria sont plus utiles en première couche que des catégories abstraites lancées seules. Elles donnent au modèle un point d’accroche concret : documentation, preuve, critères, shortlist.

Les 8 risques de dérive à surveiller

RisqueConséquence businessMitigation
Compression en GEO/AEO/AI visibilityLa différenciation disparaît dans une catégorie connueUtiliser GEO comme pont, puis définir la couche preuve/décision
Compression en SEO/content marketingL’offre paraît être une prestation de contenuAncrer dans l’évaluation fournisseur et les critères de décision
Dérive procurement/tenderLe marché se resserre trop tôt vers l’appel d’offresQualifier comme évaluation IA, pas seulement pre-tender
Reconstruction arbitraire des termes propriétairesL’IA explique un concept dans le mauvais sensIntroduire le concept propriétaire après une définition-pont
Fausse précisionL’étude perd en crédibilitéAfficher les dénominateurs, préciser le statut exploratoire et éviter les extrapolations de marché
Conseil niche sur-généraliséLe papier paraît rigoureux mais peu actionnableFiltrer les conseils non transférables
Sources survisiblesLes mauvais acteurs paraissent stratégiquesSéparer volume de citation et qualité d’autorité
Prompts vaguesLe modèle mappe la mauvaise choseUtiliser des formulations descriptives et contextualisées

Ce que Beyond Mentions en tire pour une offre nouvelle ou mal granularisée

Un lancement de catégorie, ou le repositionnement d’une offre déjà lancée, ne devrait pas commencer par un nom propriétaire. Il devrait commencer par un audit :

  1. Quels buckets l’IA utilise-t-elle spontanément ?
  2. Quels concurrents ou substituts apparaissent dans ces buckets ?
  3. Quels critères sont repris dans les comparaisons ?
  4. Quelles preuves manquent pour justifier la différenciation ?
  5. Quels termes provoquent de la confusion ?
  6. Quel Bridge Vocabulary permet d’entrer dans la carte cognitive existante ?

Cette logique prolonge les concepts d’AI Cognitive Map Audit et de Bridge Vocabulary. L’étude formalise la méthode à un niveau publiable : auditer la carte cognitive avant de publier.

Ce qu’il ne faut pas conclure

Cette étude ne prouve pas que tous les LLM classent toutes les offres de la même manière. Elle ne compare pas plusieurs modèles. Elle ne démontre pas qu’une page unique change causalement les réponses futures ou les revenus.

Elle montre une chose plus précise : dans ce corpus exploratoire, les formulations insuffisamment cadrées sont vulnérables à la compression catégorielle, et les formulations-ponts réduisent mieux la confusion que les catégories propriétaires forcées.

Passer de l’étude à l’action

Pour une entreprise qui lance ou repositionne une offre B2B, le livrable opérationnel n’est pas un rapport de visibilité. C’est une carte de décision :

  • buckets cognitifs dominants ;
  • substituts et concurrents implicites ;
  • termes à éviter ;
  • termes-ponts à utiliser ;
  • gaps documentaires à corriger ;
  • métriques de Decision Share of Voice à suivre dans le temps.

Le bon KPI de départ n’est pas : “sommes-nous visibles ?” C’est : “dans quelle logique de décision sommes-nous compris ?”

À lire ensuite

FAQ

Cette étude est-elle représentative de tout le marché GEO ?

Non. Il s’agit d’une étude exploratoire fondée sur 4 320 réponses Perplexity sonar collectées sur trois jours UTC, du 13 au 15 mai 2026. Elle décrit un corpus Beyond Mentions contrôlé, pas une vérité statistique universelle sur tous les LLM ou tous les marchés B2B.

Pourquoi utiliser Perplexity sonar plutôt qu’un panel multi-modèle ?

Perplexity sonar fournit des sources attachées aux réponses, ce qui permet d’analyser à la fois les formulations générées et l’écosystème documentaire qui les soutient. La limite est assumée : l’étude ne doit pas être présentée comme une comparaison multi-modèle.

Que signifie Category Compression Risk ?

Le Category Compression Risk désigne le risque qu’un LLM replie une offre vers une catégorie déjà connue, par exemple GEO, SEO ou procurement, alors que la proposition de valeur réelle est plus spécifique.

Quelle est la recommandation principale ?

Avant de publier ou de repositionner une offre, il faut auditer la carte cognitive des LLM : les catégories dans lesquelles l’offre est placée, les critères repris, les preuves attendues et le vocabulaire-pont qui évite les mauvaises assimilations.

Question acheteur

Quelle question l'acheteur pose-t-il à l'IA ?

Risque documentaire

Quelle simplification documentaire peut abaisser le standard ?

Standard à imposer

Quel niveau technique doit être formulé clairement ?

Preuve attendue

Quelles preuves doivent être demandées ou publiées ?

Critère de rejet

Quel critère permet d'écarter une réponse insuffisante ?

Mesurez comment l'IA comprend déjà votre marché.

Un diagnostic court permet d'identifier les compressions de catégorie, gaps documentaires et critères qui influencent la décision.