Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Her er en vanlig misforståelse om RAG!
De fleste tror RAG fungerer slik: indekser et dokument → hente det samme dokumentet.
Men indeksering ≠ gjenfinning.
Det du indekserer trenger ikke å være det du mater LLM.
Når du forstår dette, kan du bygge RAG-systemer som faktisk fungerer.
Her er 4 indekseringsstrategier som skiller god RAG fra god RAG:
1) Segment-indeksering
↳ Dette er standardtilnærmingen. Del dokumenter i biter, bygg dem inn, lagre i en vektordatabase og hent de nærmeste treffene.
↳ Enkelt og effektivt, men store eller støyende biter vil skade presisjonen din.
2) Indeksering av underdeler
↳ Del opp bitene dine i mindre underbiter for indeksering, men hent hele biten for kontekst.
↳ Dette er kraftig når en enkelt seksjon dekker flere konsepter. Du får bedre spørringsmatching uten å miste den omkringliggende konteksten LLM trenger.
3) Indeksering av spørringer
↳ I stedet for å indeksere råtekst, generer hypotetiske spørsmål som delen kan svare på. Indekser disse spørsmålene i stedet.
↳ Brukerspørsmål stemmer naturlig nok bedre overens med spørsmål enn rå dokumenttekst. Dette lukker det semantiske gapet mellom det brukerne spør om og det du har lagret.
...

Topp
Rangering
Favoritter

