Iată o concepție greșită comună despre RAG! Majoritatea oamenilor cred că RAG funcționează așa: indexează un document → recuperează același document. Dar indexarea ≠ recuperarea. Ceea ce indexezi nu trebuie să fie ceea ce hrănești LLM. Odată ce înțelegeți acest lucru, puteți construi sisteme RAG care funcționează cu adevărat. Iată 4 strategii de indexare care separă RAG bun de RAG bun: 1) Indexarea bucăților ↳ Aceasta este abordarea standard. Împărțiți documentele în bucăți, încorporați-le, stocați-le într-o bază de date vectorială și preluați cele mai apropiate potriviri. ↳ Bucăți simple și eficiente, dar mari sau zgomotoase vă vor afecta precizia. 2) Indexare sub-bucată ↳ Împărțiți bucățile în subbucăți mai mici pentru indexare, dar recuperați întreaga bucată pentru context. ↳ Acest lucru este puternic atunci când o singură secțiune acoperă mai multe concepte. Obțineți o potrivire mai bună a interogărilor fără a pierde contextul înconjurător de care are nevoie LLM-ul dvs. 3) Indexarea interogărilor ↳ În loc să indexați textul brut, generați întrebări ipotetice la care ar putea răspunde bucățile. Indexați aceste întrebări în schimb. ↳ Interogările utilizatorilor se aliniază în mod natural mai bine cu întrebările decât textul brut al documentului. Acest lucru închide decalajul semantic dintre ceea ce întreabă utilizatorii și ceea ce ați stocat. ...