Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Am înțeles în sfârșit de ce re-rankerele sunt atât de puternice odată ce am înțeles diferența cheie dintre bi- și cross-encoder.
Am găsit în continuare o modalitate de a combina puterile lor folosind o arhitectură unificată.
Permiteți-mi să vă explic:
RAG este 80% recuperare și 20% generare. Deci, dacă RAG nu funcționează, cel mai probabil, este o problemă de recuperare.
Tocmai de aceea este atât de important să obțineți arhitectura corectă de recuperare - și începe cu înțelegerea acestor două (de fapt trei) abordări de codificare.
(consultați imaginea de mai jos pe măsură ce citiți)
1️⃣ Bi-codificatoare
Bi-encoderele (coloana vertebrală a căutării vectoriale) procesează interogările și documentele separat.
- Încorporarea documentelor este precalculată
- Interogarea este încorporată în momentul căutării
Acest lucru face ca bi-encoderele să fie perfecte pentru recuperarea inițială:
- extrem de rapid
- funcționează la scară largă
- ratează informații contextuale importante
2️⃣ Codificatoare încrucișate
Codificarele încrucișate au o abordare complet diferită pentru re-clasare.
Ei procesează interogarea și fiecare document ca o singură unitate....

Limită superioară
Clasament
Favorite