Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Här är en vanlig missuppfattning om RAG!
De flesta tror att RAG fungerar så här: indexera ett dokument → hämta samma dokument.
Men indexering ≠ hämtning.
Det du indexerar behöver inte vara det du matar LLM.
När du förstår detta kan du bygga RAG-system som faktiskt fungerar.
Här är 4 indexeringsstrategier som skiljer bra RAG från bra RAG:
1) Indexering av segment
↳ Detta är standardmetoden. Dela upp dokument i bitar, bädda in dem, lagra dem i en vektordatabas och hämta de närmaste matchningarna.
↳ Enkelt och effektivt, men stora eller bullriga bitar kommer att skada din precision.
2) Indexering av undersegment
↳ Dela upp dina bitar i mindre undersegment för indexering, men hämta hela biten för sammanhang.
↳ Detta är kraftfullt när ett enda avsnitt täcker flera begrepp. Du får bättre frågematchning utan att förlora det omgivande sammanhanget som din LLM behöver.
3) Indexering av frågor
↳ Istället för att indexera rå text, generera hypotetiska frågor som segmentet kan besvara. Indexera dessa frågor i stället.
↳ Användarfrågor stämmer naturligt bättre överens med frågor än rå dokumenttext. Detta stänger det semantiska gapet mellan vad användarna frågar och vad du har lagrat.
...

Topp
Rankning
Favoriter

