Pour savoir si ChatGPT, Perplexity ou Gemini comprend vraiment votre offre, ne regardez pas seulement si l’IA cite votre marque.
Regardez comment il vous explique, avec quels concurrents il vous compare, quels critères il retient, quelles preuves il cite et dans quels cas il vous recommande.
Une IA peut connaître votre nom et mal comprendre votre valeur.
Réponse courte
Un LLM comprend une offre B2B quand cinq éléments restent cohérents.
| Élément | Question de contrôle | Bon signal |
|---|---|---|
| Catégorie | Dans quelle famille sommes-nous rangés ? | Catégorie précise et utile |
| Concurrents | Avec qui sommes-nous comparés ? | Alternatives réellement comparables |
| Critères | Comment l’offre est-elle évaluée ? | Critères différenciants repris |
| Preuves | Qu’est-ce qui justifie la lecture ? | Preuves vérifiables citées |
| Recommandation | Quand sommes-nous retenus ou écartés ? | Cas d’usage et limites corrects |
Si ces cinq éléments sont cohérents, l’IA ne vous cite pas seulement. Elle vous comprend dans une logique de décision.
Pourquoi tester plusieurs LLM
ChatGPT, Perplexity, Gemini ou Claude n’utilisent pas toujours les mêmes sources, les mêmes modes de réponse ni les mêmes seuils de prudence. Une offre peut être bien classée dans un moteur, mais mal comprise dans un autre.
| Moteur à tester | Ce que le test révèle souvent |
|---|---|
| ChatGPT | Catégorie perçue, concurrents associés, critères de choix génériques |
| Perplexity | Sources citées, preuves reprises, dépendance à certaines pages |
| Gemini | Alignement avec les résultats Google, catégories proches, signaux de marque |
| Claude | Qualité de raisonnement, limites, objections et risques |
Le bon diagnostic ne consiste donc pas à demander une fois “que penses-tu de mon offre ?”. Il consiste à comparer plusieurs réponses, sur plusieurs formulations, puis à coder les écarts.
Ce que montrent les données Beyond Mentions
Dans la première vague consolidée de l’Observatoire Beyond Mentions, nous avons analysé 4 320 réponses Perplexity sonar sur 3 jours UTC, avec 6 passes par question et par jour.
| Signal observé | Volume dans le corpus | Lecture pour la compréhension |
|---|---|---|
| Source dependency | 4 137/4 320 (95,8%) | Les sources disponibles influencent l’explication |
| Proof reuse | 3 714/4 320 (86,0%) | Les preuves peuvent stabiliser la lecture |
| Documentation and proof | 2 687/4 320 (62,2%) | La documentation aide à comprendre la valeur |
| Criteria reuse | 1 464/4 320 (33,9%) | Les critères explicites peuvent être repris |
| Category compression | 1 061/4 320 (24,6%) | Une offre peut être rangée dans la mauvaise catégorie |
| Specification gap | 1 130/4 320 (26,2%) | Les exigences peuvent être mal formulées |
Le point clé : la compréhension IA n’est pas binaire. Elle se mesure sur la cohérence entre catégorie, critères, preuves et recommandation.
Les 6 tests à lancer
1. Test de catégorie
Demandez :
“Comment définir cette offre ?”
Regardez si ChatGPT utilise une catégorie précise ou une catégorie de repli.
| Réponse | Lecture |
|---|---|
| Catégorie précise | Bon signal |
| Catégorie trop large | Risque de compression |
| Catégorie concurrente | Risque de mauvaise comparaison |
| Description vague | Documentation insuffisante |
2. Test de concurrents
Demandez :
“Quelles alternatives comparer ?”
Si les alternatives sont trop éloignées, ChatGPT ne comprend pas encore le périmètre.
3. Test de critères
Demandez :
“Quels critères utiliser pour choisir ?”
Les critères repris doivent refléter votre vraie valeur, pas seulement prix, notoriété ou fonctionnalités.
4. Test de preuve
Demandez :
“Quelles preuves demander à ce fournisseur ?”
Un bon signal apparaît quand ChatGPT cite des preuves vérifiables, pas seulement des déclarations.
5. Test de shortlist
Demandez :
“Dans quel cas recommander cette offre ?”
La réponse doit relier votre offre à des situations d’achat précises.
6. Test d’exclusion
Demandez :
“Dans quel cas ne faut-il pas choisir cette offre ?”
Une IA qui sait exclure correctement comprend souvent mieux qu’une IA qui recommande trop largement.
Diagnostic
| Symptôme | Problème probable | Correction |
|---|---|---|
| ChatGPT vous cite mais vous explique mal | Définition faible | Publier une définition de catégorie |
| Les concurrents sont incohérents | Category fit faible | Clarifier mauvais substituts |
| Les critères sont génériques | Critères différenciants absents | Publier matrices et seuils |
| Les preuves ne sortent pas | Proof reuse faible | Rendre les preuves extractibles |
| L’offre est recommandée trop largement | Limites absentes | Publier limites et critères de rejet |
| Le prix domine | Risque évité invisible | Documenter le coût d’une mauvaise décision |
Grille de score simple
| Dimension | 0 | 1 | 2 |
|---|---|---|---|
| Catégorie | Fausse | Large | Précise |
| Concurrents | Incohérents | Partiels | Pertinents |
| Critères | Génériques | Mixtes | Différenciants |
| Preuves | Absentes | Déclaratives | Vérifiables |
| Recommandation | Vague | Partielle | Contextualisée |
| Exclusion | Absente | Floue | Actionnable |
Un score faible ne signifie pas que votre offre est mauvaise. Il signifie que votre documentation ne rend pas encore la bonne lecture assez facile.
À retenir
ChatGPT, Perplexity ou Gemini comprennent vraiment votre offre quand ils peuvent :
- la placer dans la bonne catégorie ;
- la comparer aux bons concurrents ;
- reprendre les bons critères ;
- citer les bonnes preuves ;
- recommander les bons cas d’usage ;
- exclure les mauvais cas.
La question n’est donc pas :
“L’IA parle-t-elle de nous ?”
La vraie question est :
“L’IA prépare-t-elle une décision fidèle à notre valeur réelle ?”
À lire ensuite
- Pourquoi je suis cité par ChatGPT ou Perplexity mais je ne vends pas ? : pour distinguer citation et recommandation.
- Category Compression Risk : pour comprendre les mauvaises catégories.
- Pourquoi les IA recommandent-elles certains prestataires plutôt que d’autres ? : pour relier compréhension et recommandation.
- Documentation Blind Spot : pour corriger les preuves absentes.
FAQ
Un simple prompt suffit-il pour savoir si un LLM comprend mon offre ?
Non. Une réponse isolée peut varier. Il faut tester plusieurs questions, plusieurs angles et coder les patterns récurrents.
Quel est le meilleur signal de compréhension ?
Le meilleur signal est la cohérence entre catégorie, concurrents, critères, preuves et situations dans lesquelles ChatGPT, Perplexity ou Gemini recommande ou exclut l'offre.
Que faire si l'IA simplifie mon offre ?
Publiez des définitions, critères, preuves, cas d'usage, limites et critères de rejet qui rendent la vraie catégorie plus facile à reprendre.
Quelle différence entre être compris et être cité ?
Être cité signifie apparaître. Être compris signifie être expliqué, comparé et recommandé avec les bons critères.
Quelle question l'acheteur pose-t-il à l'IA ?
Quelle simplification documentaire peut abaisser le standard ?
Quel niveau technique doit être formulé clairement ?
Quelles preuves doivent être demandées ou publiées ?
Quel critère permet d'écarter une réponse insuffisante ?