المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
إليك اعتقاد خاطئ شائع حول RAG!
يعتقد معظم الناس أن RAG يعمل على النحو التالي: فهرسة مستند → استرداد نفس المستند.
لكن الفهرسة ≠ الاسترجاع.
ما تقوم بفهرسته لا يجب أن يكون ما تطعمه ب LLM.
بمجرد فهم ذلك ، يمكنك بناء أنظمة RAG التي تعمل بالفعل.
فيما يلي 4 استراتيجيات فهرسة تفصل RAG الجيد عن RAG الرائع:
1) فهرسة القطع
↳ هذا هو النهج القياسي. قم بتقسيم المستندات إلى أجزاء وتضمينها وتخزينها في قاعدة بيانات متجهة واسترداد أقرب التطابقات.
↳ القطع البسيطة والفعالة ، ولكن الكبيرة أو الصاخبة ستضر بدقتك.
2) فهرسة الجزء الفرعي
↳ قسم القطع إلى أجزاء فرعية أصغر للفهرسة ، ولكن استرجع الجزء الكامل للسياق.
↳ هذا قوي عندما يغطي قسم واحد مفاهيم متعددة. يمكنك الحصول على مطابقة أفضل للاستعلام دون فقدان السياق المحيط الذي يحتاجه LLM.
3) فهرسة الاستعلام
↳ بدلا من فهرسة النص الخام ، قم بإنشاء أسئلة افتراضية يمكن أن يجيب عليها القطعة. فهرسة هذه الأسئلة بدلا من ذلك.
↳ تتوافق استعلامات المستخدم بشكل طبيعي مع الأسئلة بشكل أفضل من نص المستند الخام. يؤدي هذا إلى سد الفجوة الدلالية بين ما يطلبه المستخدمون وما قمت بتخزينه.
...

الأفضل
المُتصدِّرة
التطبيقات المفضلة

