Pipeline AI Mode
Chunk
Aussi appelé : Fragment, Passage
Définition
Fragment de page, généralement de 134 à 167 mots, extrait par le pipeline de retrieval. Trois logiques de découpage cumulables : layout-aware (basée sur la structure HTML), semantic (regroupement de phrases proches), recursive (paragraphes vers phrases vers tokens).
Voir aussi
- Passage retrieval — Technique consistant à récupérer des fragments de pages (chunks) plutôt que des pages entières.
- Extractabilité — Capacité d un passage à être extrait et cité hors contexte.
- Micro-paragraphe — Paragraphe de 4 à 6 lignes maximum traitant d une seule idée.