Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Zde je běžná mylná představa o RAG!
Většina lidí si myslí, že RAG funguje takto: indexujte dokument → načtěte stejný dokument.
Ale indexování ≠ načítání.
To, co indexujete, nemusí být to, co krmíte LLM.
Jakmile to pochopíte, můžete vytvářet systémy RAG, které skutečně fungují.
Zde jsou 4 strategie indexování, které oddělují dobrý RAG od skvělého RAG:
1) Indexování bloků
↳ Toto je standardní přístup. Rozdělte dokumenty na bloky, vkládejte je, ukládejte do vektorové databáze a načítejte nejbližší shody.
↳ Jednoduché a účinné, ale velké nebo hlučné kusy poškodí vaši přesnost.
2) Indexování dílčích bloků
↳ Rozdělte své bloky na menší dílčí části pro indexování, ale načtěte celý blok pro kontext.
↳ To je výkonné, když jedna část pokrývá více konceptů. Získáte lepší porovnávání dotazů bez ztráty okolního kontextu, který váš LLM potřebuje.
3) Indexování dotazů
↳ Místo indexování surového textu generujte hypotetické otázky, na které by blok mohl odpovědět. Místo toho tyto otázky indexujte.
↳ Uživatelské dotazy se přirozeně lépe shodují s otázkami než nezpracovaný text dokumentu. Tím se překlene sémantická mezera mezi tím, na co se uživatelé ptají, a tím, co jste uložili.
...

Top
Hodnocení
Oblíbené

