Pipeline AI Mode

Chunk

Aussi appelé : Fragment, Passage

Définition

Fragment de page, généralement de 134 à 167 mots, extrait par le pipeline de retrieval. Trois logiques de découpage cumulables : layout-aware (basée sur la structure HTML), semantic (regroupement de phrases proches), recursive (paragraphes vers phrases vers tokens).

Voir aussi

  • Passage retrieval — Technique consistant à récupérer des fragments de pages (chunks) plutôt que des pages entières.
  • Extractabilité — Capacité d un passage à être extrait et cité hors contexte.
  • Micro-paragraphe — Paragraphe de 4 à 6 lignes maximum traitant d une seule idée.

Retour au glossaire