熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這是關於 RAG 的一個常見誤解!
大多數人認為 RAG 的運作方式是:索引一個文檔 → 檢索該文檔。
但索引 ≠ 檢索。
你所索引的內容不必是你提供給 LLM 的內容。
一旦你理解這一點,你就可以構建實際有效的 RAG 系統。
以下是 4 種索引策略,可以將優秀的 RAG 與卓越的 RAG 區分開來:
1) 碎片索引
↳ 這是標準方法。將文檔拆分為碎片,嵌入它們,存儲在向量數據庫中,並檢索最接近的匹配項。
↳ 簡單有效,但大型或嘈雜的碎片會影響你的精確度。
2) 子碎片索引
↳ 將你的碎片拆分為更小的子碎片進行索引,但檢索完整的碎片以獲取上下文。
↳ 當單個部分涵蓋多個概念時,這是非常強大的。你可以在不失去 LLM 所需的周圍上下文的情況下獲得更好的查詢匹配。
3) 查詢索引
↳ 不要索引原始文本,而是生成假設性問題,該碎片可以回答。索引這些問題。
↳ 用戶查詢自然與問題比與原始文檔文本更對齊。這縮小了用戶詢問的內容與你所存儲的內容之間的語義差距。
...

熱門
排行
收藏

