一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

這是關於 RAG 的一個常見誤解！大多數人認為 RAG 的運作方式是：索引一個文檔 → 檢索該文檔。但索引 ≠ 檢索。你所索引的內容不必是你提供給 LLM 的內容。一旦你理解這一點，你就可以構建實際有效的 RAG 系統。以下是 4 種索引策略，可以將優秀的 RAG 與卓越的 RAG 區分開來： 1) 碎片索引 ↳ 這是標準方法。將文檔拆分為碎片，嵌入它們，存儲在向量數據庫中，並檢索最接近的匹配項。 ↳ 簡單有效，但大型或嘈雜的碎片會影響你的精確度。 2) 子碎片索引 ↳ 將你的碎片拆分為更小的子碎片進行索引，但檢索完整的碎片以獲取上下文。 ↳ 當單個部分涵蓋多個概念時，這是非常強大的。你可以在不失去 LLM 所需的周圍上下文的情況下獲得更好的查詢匹配。 3) 查詢索引 ↳ 不要索引原始文本，而是生成假設性問題，該碎片可以回答。索引這些問題。 ↳ 用戶查詢自然與問題比與原始文檔文本更對齊。這縮小了用戶詢問的內容與你所存儲的內容之間的語義差距。 ...