Pipeline AI Mode
Layout-aware chunking
Définition
Découpage des pages en chunks selon leur structure HTML. Les balises H2 et H3 servent de frontières naturelles. Une page sans hiérarchie typographique claire produit des chunks confus.
Voir aussi
- Chunk — Fragment de page, généralement de 134 à 167 mots, extrait par le pipeline de retrieval.
- Passage retrieval — Technique consistant à récupérer des fragments de pages (chunks) plutôt que des pages entières.