Här är en vanlig missuppfattning om RAG! De flesta tror att RAG fungerar så här: indexera ett dokument → hämta samma dokument. Men indexering ≠ hämtning. Det du indexerar behöver inte vara det du matar LLM. När du förstår detta kan du bygga RAG-system som faktiskt fungerar. Här är 4 indexeringsstrategier som skiljer bra RAG från bra RAG: 1) Indexering av segment ↳ Detta är standardmetoden. Dela upp dokument i bitar, bädda in dem, lagra dem i en vektordatabas och hämta de närmaste matchningarna. ↳ Enkelt och effektivt, men stora eller bullriga bitar kommer att skada din precision. 2) Indexering av undersegment ↳ Dela upp dina bitar i mindre undersegment för indexering, men hämta hela biten för sammanhang. ↳ Detta är kraftfullt när ett enda avsnitt täcker flera begrepp. Du får bättre frågematchning utan att förlora det omgivande sammanhanget som din LLM behöver. 3) Indexering av frågor ↳ Istället för att indexera rå text, generera hypotetiska frågor som segmentet kan besvara. Indexera dessa frågor i stället. ↳ Användarfrågor stämmer naturligt bättre överens med frågor än rå dokumenttext. Detta stänger det semantiska gapet mellan vad användarna frågar och vad du har lagrat. ...