Anatomie du search fan-out : du clic à la réponse générée

Le search fan-out n est pas une nouvelle SERP. C est un changement de pipeline. La requête entrante n est plus servie en l État : elle est décomposée, reformulee, eclatee en une dizaine de sous-requêtes, exécutées en parallele, puis recombinee par un modele génératif. Ce guide pose le cadre conceptuel utile a toute la rédaction.

Pourquoi parler de pipeline plutot que d algorithme

L algorithme classique de Google recevait un mot-clé, l alignait sur un index inverse, retournait dix bleus liens. La logique etait determinable : chaque facteur de ranking pouvait être teste, isole, optimise.

L AI Mode brise ce contrat. Il introduit un pipeline en cascade où plusieurs sous-systèmes interviennent avant qu une réponse n apparaisse. Aucun de ces sous-systèmes n est completement deterministe. La consequence opérationnelle est immediate : on ne peut plus penser visibilite en termes de positionnement sur une requête cible. Il faut penser couverture sur un faisceau de requêtes synthetiques.

Le mot pipeline n est pas une coquetterie. Il dicte la maniere de produire le contenu. Une page ne sera plus jugee sur sa capacite a couvrir un mot-clé, mais sur sa capacite a fournir des réponses intermédiaires utiles a un grand modele de langage qui assemble la sortie.

Étape 1, classification d intention

Le premier composant du pipeline classe l intention. Il identifié le domaine informationnel (sante, finance, voyage), le sous-domaine (assurance auto, medecine douce), la tache utilisateur (achat, comprehension, comparaison) et passe une serie de vérifications de sécurité (la requête est-elle sensible, juridique, médicale).

Cette classification conditionne tout le reste. Une requête classee informationnelle ne donnera pas le même fan-out qu une requête transactionnelle. La presence de signaux de sensibilite (sante, finances) restreint les sources autorisees pour la synthese.

Pour la rédaction, retenir une chose : la catégorisation d une page par schema.org et par son champ semantique conditionne sa sélection au stade du retrieval. Une page mal etiquetee ne sera tout simplement pas envisagee dans le faisceau.

Étape 2, slot identification

Vient ensuite la phase de slot identification. Le système remplit des cases : explicite (la requête contient demi-marathon, donc la distance est posee), implicite (le niveau de l athlete, son age, son objectif final ne sont pas precises mais existent comme variables latentes).

Mike King insiste sur ce point : même si toutes les cases ne sont pas remplies, leur existence influence la génération des sous-requêtes. Un slot vide ouvre une porte que le modele tentera de combler en cherchant du contenu capable de la fermer.

Concrètement, une page qui adresse plusieurs slots simultanement (par exemple : niveau debutant + objectif finition + duree de preparation = 12 semaines) augmente sa probabilité d être sélectionnée dans le retrieval, parce qu elle ferme plusieurs portes en une seule lecture.

Étape 3, génération des sous-requêtes

Au centre du pipeline, le module qui rend le fan-out visible : Gemini 2.5 Pro, customise par Google, recoit la requête, son intention classee, ses slots et produit une liste de sous-requêtes synthetiques. Le brevet WO2024064249A1 documente cette étape sans la nommer explicitement fan-out.

Mike King distingue sept types de sous-requêtes :

Related, extensions thématiques de la requête principale.
Implicit, questions que l utilisateur n a pas posees mais qui completent son besoin.
Comparative, alternatives, options, mises en concurrence.
Récent, versions temporelles (cette année, la semaine derniere).
Personalized, adapte a un profil suppose (debutant, professionnel).
Reformulation, même intention, formulation differente.
Entity-expanded, entites associees apparues lors du graph lookup.

Ces sept types ne sont pas exclusifs. Une seule requête entrante généré generalement entre dix et quinze sous-requêtes, melant plusieurs catégories. Selon nos lectures, l ordre de génération suit grossierement la pyramide : reformulation et related en majorite, implicit et comparative ensuite, le reste en queue.

Étape 4, recuperation et chunking

Chaque sous-requête declenche une recherche dans l index. Les résultats ne sont pas des pages entieres : ce sont des chunks. Le système découpe les pages selon trois logiques cumulables : layout-aware (basee sur la structure HTML), semantic (regroupement de phrases proches), recursive (paragraphes vers phrases vers tokens).

La consequence éditoriale est décisive : ce qui est retenu, ce sont des fragments. Une page mal structuree, sans hiérarchie de titres, sans paragraphes courts et auto-portants, donne des chunks pauvres. A l inverse, une page conçue avec des micro-paragraphes auto-suffisants offre des chunks reutilisables.

Cette étape repond au problème classique : pourquoi une page bien classee en SEO classique peut être completement ignoree par l AI Mode. Réponse : ses chunks ne sont pas exploitables.

Étape 5, synthese par le modele génératif

Une fois les chunks reunis, ils sont passes au modele génératif (Gemini) qui synthetise une réponse. Cette synthese est la partie visible. Le reste du pipeline est invisible côté utilisateur, mais determine entierement ce qui apparait.

Le modele privilégie les chunks cohérents avec l intention initiale, ceux qui ferment plusieurs slots, ceux qui sont sourçable. Il évite les chunks contradictoires entre eux. Il insère des citations vers les domaines d origine quand sa configuration le permet.

Pour la rédaction, l implication la plus contre-intuitive est la suivante : un texte excellent en lecture humaine peut être invisible dans la synthese si ses chunks ne portent pas eux-mêmes la valeur. Le titre seul ne sauve pas la page.

Ce qui change concrètement pour la rédaction

Le pipeline a trois implications opérationnelles.

Premiere implication. La hiérarchie typographique cesse d être un detail esthetique. Les H2 et H3 servent au layout-aware chunking : un titre clair encadre un chunk autonome.

Deuxieme implication. Les paragraphes longs, qui mixent plusieurs idees, deviennent des passifs. On les découpe en sections de quatre a six lignes, chacune portant une idee citable.

Troisieme implication. Les pages doivent fermer plusieurs slots à la fois pour être retenues. Cela signifie écrire pour des intentions adjacentes, pas pour une seule. Une page qui ne couvre qu un slot très précis est performante en SEO classique mais pauvre en fan-out.

Ces trois changements forment la base du cluster Optimisation, où nous detaillons les rituels de production.

Sources et lectures complementaires

Mike King, How AI Mode Works and How SEO Can Prepare for the Future of Search, iPullRank, 2025.
iPullRank, fiche outil Qforia, 2025.
Brevet WO2024064249A1, Methods and systems for generating synthetic queries from a search query.
WordLift, Query Fan-Out: A Data-Driven Approach to AI Search Visibility, 2025.
Speaker Deck de Mike King, Everything You MFs Should Know About Query Fan Out, TechSEO Connect.

Pour la mise en pratique, consulter le guide complementaire Optimiser pour le fan-out vs SEO classique et l étude Couverture fan-out par verticale.