Zde je běžná mylná představa o RAG! Většina lidí si myslí, že RAG funguje takto: indexujte dokument → načtěte stejný dokument. Ale indexování ≠ načítání. To, co indexujete, nemusí být to, co krmíte LLM. Jakmile to pochopíte, můžete vytvářet systémy RAG, které skutečně fungují. Zde jsou 4 strategie indexování, které oddělují dobrý RAG od skvělého RAG: 1) Indexování bloků ↳ Toto je standardní přístup. Rozdělte dokumenty na bloky, vkládejte je, ukládejte do vektorové databáze a načítejte nejbližší shody. ↳ Jednoduché a účinné, ale velké nebo hlučné kusy poškodí vaši přesnost. 2) Indexování dílčích bloků ↳ Rozdělte své bloky na menší dílčí části pro indexování, ale načtěte celý blok pro kontext. ↳ To je výkonné, když jedna část pokrývá více konceptů. Získáte lepší porovnávání dotazů bez ztráty okolního kontextu, který váš LLM potřebuje. 3) Indexování dotazů ↳ Místo indexování surového textu generujte hypotetické otázky, na které by blok mohl odpovědět. Místo toho tyto otázky indexujte. ↳ Uživatelské dotazy se přirozeně lépe shodují s otázkami než nezpracovaný text dokumentu. Tím se překlene sémantická mezera mezi tím, na co se uživatelé ptají, a tím, co jste uložili. ...