Glossaire

Le glossaire de la recherche générative

60+ termes définis, bilingues fr/en quand pertinent. Référence opposable, sources tracées. Mis à jour à chaque évolution du vocabulaire.

Pipeline AI Mode

AI Mode Google AI Mode: Mode de recherche conversationnel de Google déployé en 2024-2025 qui utilise Gemini pour générer des réponses synthétisées à partir de plusieurs sous-requêtes exécutées en parallèle. Distinct des AI Overviews, plus exhaustif et itératif.
AI Overviews AIO: Encadrés générés par IA affichés en tête de SERP Google sur certaines requêtes. Présents sur 47 à 48 % des recherches US en 2026. Synthèse de quelques sources citées en pied de bloc.
Chunk Fragment: Fragment de page, généralement de 134 à 167 mots, extrait par le pipeline de retrieval. Trois logiques de découpage cumulables : layout-aware (basée sur la structure HTML), semantic (regroupement de phrases proches), recursive (paragraphes vers phrases vers tokens).
Classification d intention: Première étape du pipeline AI Mode : classer la requête entrante (domaine, sous-domaine, tâche utilisateur, sensibilité YMYL). La classification conditionne le routage vers le bon LLM et la sélection des sources autorisées.
Layout-aware chunking: Découpage des pages en chunks selon leur structure HTML. Les balises H2 et H3 servent de frontières naturelles. Une page sans hiérarchie typographique claire produit des chunks confus.
Passage retrieval Récupération par passage: Technique consistant à récupérer des fragments de pages (chunks) plutôt que des pages entières. Au stade du retrieval, AI Mode sélectionne des passages auto-suffisants, sourçables et alignés avec une sous-requête précise.
Search fan-out Query fan-out: Mécanisme par lequel l AI Mode de Google décompose une requête entrante en dix à quinze sous-requêtes synthétiques, exécute chacune en parallèle, récupère des fragments de pages et recombine le tout dans une réponse synthétisée par Gemini.
Slot identification Identification de slot: Étape du pipeline AI Mode qui identifie les variables explicites (présentes dans la requête) et implicites (latentes) liées à l intention utilisateur. Une page qui ferme plusieurs slots simultanément augmente sa probabilité d être sélectionnée.

Taxonomie des sous-requêtes

Comparative queries Requêtes comparatives: Sous-requêtes qui mettent deux options en concurrence. Catégorie dominante en ecommerce, finance et B2B SaaS. Une page sans comparaison ferme un slot que la concurrence ferme.
Entity-expanded queries Requêtes enrichies par entités: Sous-requêtes qui ajoutent ou substituent une entité (marque, lieu, règle, événement). Reflètent la cartographie entitaire du knowledge graph autour du sujet.
Implicit queries Requêtes implicites: Sous-requêtes qui portent sur ce que l utilisateur veut savoir mais n a pas formulé. Tentent de fermer les slots non remplis. Catégorie où le fan-out apporte le plus d information par rapport au keyword research classique.
Personalized queries Requêtes personnalisées: Sous-requêtes qui adaptent la requête à un profil supposé : profession, niveau, budget, contexte d usage. Fragmentent la requête par profil utilisateur.
Recent queries Requêtes récentes: Sous-requêtes qui cherchent l information à jour avec un marqueur temporel explicite ou implicite. Décisives sur les sujets soumis à évolution rapide : finance, technologies, voyage.
Reformulation queries Requêtes reformulées: Sous-requêtes qui sont des variantes lexicales de la requête principale. Catégorie la moins différenciante : un index inverse tolère déjà ces variations.
Related queries Requêtes liées: Sous-requêtes qui étendent thématiquement la requête principale tout en restant dans son sujet. Catégorie la plus naturelle, proche des questions associées des outils SEO classiques.
Sous-requête synthétique Synthetic query: Requête générée par le LLM à partir de la requête entrante, exécutée en parallèle pour récupérer des chunks pertinents. Mike King distingue sept types principaux qui couvrent l essentiel des intentions latentes.

Métriques

Citation depth Profondeur de citation: Position moyenne d un domaine dans la liste des citations affichées par AI Mode (première, deuxième, troisième). Plus la position est haute, plus le chunk est jugé canonique.
Citation rate Taux de citation: Pourcentage des réponses AI qui citent un domaine donné parmi celles où il pourrait apparaître. Substitut moderne au CTR sur les SERP traditionnelles.
Coverage score Score de couverture: Pourcentage des sous-requêtes du fan-out d un pivot qu une page ferme effectivement. Calculé via score d embedding entre chaque sous-requête et les chunks de la page.
Extractabilité Extractability: Capacité d un passage à être extrait et cité hors contexte. Premier des cinq filtres iPullRank du passage retrieval. Tables et FAQs ont une extractabilité supérieure aux paragraphes.
Freshness Fraîcheur: Caractère récent du contenu. Le contenu cité par AI est en moyenne 25,7 % plus frais que la SERP traditionnelle. Date de publication et date de mise à jour explicites sont des signaux directs.
Mention rate Taux de mention: Fréquence d apparition d un domaine dans les réponses AI Mode pour une liste de requêtes cibles. Mesuré par échantillonnage, indicateur clé de visibilité générative.

Standards et balisages

DefinedTermSet: Type Schema.org pour publier un glossaire structuré. Chaque entrée DefinedTerm peut avoir name, alternateName, description et inDefinedTermSet. Idéal pour bâtir une autorité topique.
EEAT Experience Expertise Authoritativeness Trustworthiness: Cadre Google d évaluation de la qualité d un contenu. Acronyme étendu en 2022 (ajout d Experience). S évalue désormais hors YMYL : ecommerce reviews, SaaS comparisons, how-to guides.
FAQPage: Type Schema.org pour les paires question/réponse. Augmente significativement le citation rate (41 % vs 15 % sans). Doit être appliqué uniquement aux pages réellement structurées en Q/R.
Helpful Content System HCU: Système algorithmique Google introduit en 2022, intégré au core algorithm en mars 2024. Évalue si une page est utile pour l utilisateur. Updates répétés ont entraîné des drops de 85-95 % sur certains sites.
JSON-LD: Format de sérialisation JSON pour le linked data. Forme dominante d implémentation Schema.org. Recommandation : utiliser un @graph connecté par identifiants stables plutôt que des nœuds isolés.
Knowledge Graph Graphe de connaissance: Base de connaissance entitaire de Google, alimentée par Wikidata et d autres sources. Une entrée Wikidata avec sameAs cohérent reste l input numéro un pour qu une marque soit reconnue comme entité.
Masthead Ours: Page éditoriale identifiant la rédaction, ses responsabilités et son organigramme. Propriété Schema.org masthead de NewsMediaOrganization. Renforce les signaux EEAT pour les médias.
Navboost: Système Google de scoring basé sur les signaux utilisateur (clic, dwell time, retour SERP) sur 13 mois. Confirmé par les fuites Google de mai 2024. Influence majeure sur le ranking core et les évaluations de qualité.
NewsMediaOrganization: Type Schema.org dédié aux organisations média. Permet de déclarer publishingPrinciples, correctionsPolicy, ethicsPolicy, masthead, verificationFactCheckingPolicy. Renforce les signaux EEAT.
sameAs: Propriété Schema.org qui pointe vers d autres URIs représentant la même entité. Permet de connecter une organisation à son Wikidata, LinkedIn, Crunchbase, X, etc. Cohérence sameAs = signal d entité fort.
Schema.org: Vocabulaire de balisage sémantique soutenu par Google, Microsoft, Yandex. Implémenté en JSON-LD ou microdata. Utilisé comme signal de classification au stade du retrieval AI Mode.
Wikidata: Base de données collaborative liée à Wikipédia. Source d entrée principale du Knowledge Graph Google. Créer une entrée propre avec statements P31, P856, P407 est l action de plus haut levier pour une marque éditoriale.
YMYL Your Money Your Life: Catégorie de pages traitant de sujets pouvant impacter santé, finances ou sécurité de l utilisateur. EEAT évalué avec une exigence renforcée. Médecine, droit, finance personnelle, parentalité.

Concepts éditoriaux

AEO Answer Engine Optimization: Optimisation pour les moteurs de réponse (ChatGPT, Perplexity, Gemini). Sous-ensemble du GEO centré sur l obtention de citations dans les réponses des LLM. Très lié à l extractabilité des chunks.
BLUF Bottom Line Up Front: Pattern rédactionnel consistant à placer la réponse directe en 40 à 60 mots juste après le H1. Optimise l extractabilité par les LLM et la satisfaction de l intent en moins de cinq secondes.
Brand authority Autorité de marque: Mesure de la reconnaissance et de la crédibilité d une marque. Signal majeur en 2026 : brand searches volume, mentions sans lien, cohérence sameAs, entrée Wikidata. Eli Schwartz : la visibilité LLM passe par le brand.
Corrections policy Politique de corrections: Politique éditoriale documentant le processus de correction des erreurs. Visible publiquement, datée, opposable. Propriété correctionsPolicy de NewsMediaOrganization.
Editorial standards Politique éditoriale: Document opposable décrivant le processus éditorial : sources acceptées, fact-check, indépendance, traitement des conflits d intérêt. Renforce les signaux EEAT et permet le lien vers publishingPrinciples.
Embedding Plongement vectoriel: Représentation vectorielle d un texte dans un espace continu. Permet de mesurer la similarité sémantique entre une sous-requête et un chunk via distance cosinus. Cœur du retrieval moderne.
Entité Entity: Unité conceptuelle reconnue par Google : personne, organisation, lieu, événement, produit. L identification entitaire conditionne la sélection d une page au stade du retrieval AI Mode.
Fact-check Vérification factuelle: Vérification d une affirmation par une seconde personne avant publication. Rendu visible en pied d article via une fact-check box. Renforce les signaux EEAT et la confiance utilisateur.
Fenêtre Navboost 13 mois: Période sur laquelle Google trace les signaux utilisateur via Navboost. Confirmé par les fuites de mai 2024. Implication : redresser un site demande au moins 13 mois de bons signaux UX.
GEO Generative Engine Optimization: Discipline d optimisation des contenus pour les moteurs de recherche génératifs. Concept formalisé en 2023 par Aggarwal et al. (Princeton, Georgia Tech). Distinct du SEO et de l AEO.
Information Gain: Concept Google brevet US-2024 : valeur informationnelle apportée par une page qui ne pourrait pas être obtenue par consensus. Remplace le keyword gap traditionnel à l ère générative.
Inverted pyramid Pyramide inversée: Structure rédactionnelle journalistique : information principale en tête, détails ensuite. Adaptée à l AI Mode : TL;DR puis tableau récap, puis sections H2 en questions, puis FAQ structurée.
LLM Large Language Model: Modèle de langage de grande taille (Gemini, GPT, Claude, Mistral). Génère du texte en prédisant le token suivant. Au cœur de l AI Mode et des moteurs génératifs.
Micro-paragraphe: Paragraphe de 4 à 6 lignes maximum traitant d une seule idée. Première phrase auto-suffisante portant le sens. Maximise l extractabilité par chunking sémantique.
Original research Recherche originale: Données collectées et analysées en propre, non disponibles ailleurs. Signal EEAT majeur en 2026 : ce qu un LLM ne peut pas générer par consensus devient la principale source de différenciation.
RAG Retrieval-Augmented Generation: Architecture des systèmes IA qui récupèrent des fragments d une base externe avant de générer une réponse. AI Mode est une forme de RAG : retrieval massif puis synthèse par Gemini.
SERP Search Engine Results Page: Page de résultats d un moteur de recherche. En 2026, la SERP Google moyenne intègre AI Overviews sur 47 à 48 % des requêtes US, ce qui réduit fortement le CTR organique classique.
TL;DR Too long didn t read: Encadré de 3 à 5 puces synthétisant l essentiel d un article. Placé juste après le BLUF. Format hautement extractable par les LLM, prisé en AI Mode.

Outils

Qforia: Outil iPullRank, ouvert en 2025. Génère un fan-out à partir d une requête et d une clé Gemini. Étiquette chaque sous-requête par type, intention et reasoning. Référence grand public du domaine.
WordLift: Suite SaaS d entity SEO et knowledge graph publishing fondée par Andrea Volpini. Propose un Query Fan-Out Simulator, des outils de balisage automatique et un service d ontology-driven SEO agent.

Personnes et entités

Aleyda Solis: Consultante SEO internationale, fondatrice d Orainti. Publie une checklist de référence d AI Search Optimization. Newsletter Crawling Mondays et conférences fréquentes (SMX, BrightonSEO).
Andrea Volpini: Co-fondateur et CEO de WordLift. Pionnier de l entity SEO et du knowledge graph publishing. Publie régulièrement sur les implications LLM pour la sémantique web.
Eli Schwartz: Auteur de Product-Led SEO. Position en 2026 : la visibilité LLM passe par le brand marketing, pas par les checklists AEO. Référence pour les stratégies SEO long-terme.
Gemini: Famille de modèles génératifs développés par Google DeepMind. La version Gemini 2.5 Pro alimente AI Mode et l essentiel des AI Overviews à partir de 2025.
Glenn Gabe: Fondateur de GSQi, spécialiste des Google Core Updates. Auteur d analyses approfondies sur HCU et Navboost. Référence pour les services de recovery post-update.
iPullRank: Agence SEO américaine fondée par Mike King. Référence centrale sur AI Mode et query fan-out. Publie The AI Search Manual et organise la conférence SEO Week.
Kevin Indig: Consultant SEO et auteur de la newsletter Growth Memo. Théoricien du decoupling clicks/impact en 2026. Anticipe la bifurcation web bots vs humains.
Lily Ray: Senior Director SEO, expert EEAT et Helpful Content Updates. Publie l analyse de référence sur les sites touchés par les Core Updates. Auteure prolifique sur Substack et Search Engine Land.
Mike King: Fondateur de iPullRank. A popularisé le concept de query fan-out à partir de 2025. Auteur de The AI Search Manual. Search Marketer of the Year 2025 (Search Engine Land).