Am înțeles în sfârșit de ce re-rankerele sunt atât de puternice odată ce am înțeles diferența cheie dintre bi- și cross-encoder. Am găsit în continuare o modalitate de a combina puterile lor folosind o arhitectură unificată. Permiteți-mi să vă explic: RAG este 80% recuperare și 20% generare. Deci, dacă RAG nu funcționează, cel mai probabil, este o problemă de recuperare. Tocmai de aceea este atât de important să obțineți arhitectura corectă de recuperare - și începe cu înțelegerea acestor două (de fapt trei) abordări de codificare. (consultați imaginea de mai jos pe măsură ce citiți) 1️⃣ Bi-codificatoare Bi-encoderele (coloana vertebrală a căutării vectoriale) procesează interogările și documentele separat. - Încorporarea documentelor este precalculată - Interogarea este încorporată în momentul căutării Acest lucru face ca bi-encoderele să fie perfecte pentru recuperarea inițială: - extrem de rapid - funcționează la scară largă - ratează informații contextuale importante 2️⃣ Codificatoare încrucișate Codificarele încrucișate au o abordare complet diferită pentru re-clasare. Ei procesează interogarea și fiecare document ca o singură unitate....