Her er en vanlig misforståelse om RAG! De fleste tror RAG fungerer slik: indekser et dokument → hente det samme dokumentet. Men indeksering ≠ gjenfinning. Det du indekserer trenger ikke å være det du mater LLM. Når du forstår dette, kan du bygge RAG-systemer som faktisk fungerer. Her er 4 indekseringsstrategier som skiller god RAG fra god RAG: 1) Segment-indeksering ↳ Dette er standardtilnærmingen. Del dokumenter i biter, bygg dem inn, lagre i en vektordatabase og hent de nærmeste treffene. ↳ Enkelt og effektivt, men store eller støyende biter vil skade presisjonen din. 2) Indeksering av underdeler ↳ Del opp bitene dine i mindre underbiter for indeksering, men hent hele biten for kontekst. ↳ Dette er kraftig når en enkelt seksjon dekker flere konsepter. Du får bedre spørringsmatching uten å miste den omkringliggende konteksten LLM trenger. 3) Indeksering av spørringer ↳ I stedet for å indeksere råtekst, generer hypotetiske spørsmål som delen kan svare på. Indekser disse spørsmålene i stedet. ↳ Brukerspørsmål stemmer naturlig nok bedre overens med spørsmål enn rå dokumenttekst. Dette lukker det semantiske gapet mellom det brukerne spør om og det du har lagret. ...