إليك اعتقاد خاطئ شائع حول RAG! يعتقد معظم الناس أن RAG يعمل على النحو التالي: فهرسة مستند → استرداد نفس المستند. لكن الفهرسة ≠ الاسترجاع. ما تقوم بفهرسته لا يجب أن يكون ما تطعمه ب LLM. بمجرد فهم ذلك ، يمكنك بناء أنظمة RAG التي تعمل بالفعل. فيما يلي 4 استراتيجيات فهرسة تفصل RAG الجيد عن RAG الرائع: 1) فهرسة القطع ↳ هذا هو النهج القياسي. قم بتقسيم المستندات إلى أجزاء وتضمينها وتخزينها في قاعدة بيانات متجهة واسترداد أقرب التطابقات. ↳ القطع البسيطة والفعالة ، ولكن الكبيرة أو الصاخبة ستضر بدقتك. 2) فهرسة الجزء الفرعي ↳ قسم القطع إلى أجزاء فرعية أصغر للفهرسة ، ولكن استرجع الجزء الكامل للسياق. ↳ هذا قوي عندما يغطي قسم واحد مفاهيم متعددة. يمكنك الحصول على مطابقة أفضل للاستعلام دون فقدان السياق المحيط الذي يحتاجه LLM. 3) فهرسة الاستعلام ↳ بدلا من فهرسة النص الخام ، قم بإنشاء أسئلة افتراضية يمكن أن يجيب عليها القطعة. فهرسة هذه الأسئلة بدلا من ذلك. ↳ تتوافق استعلامات المستخدم بشكل طبيعي مع الأسئلة بشكل أفضل من نص المستند الخام. يؤدي هذا إلى سد الفجوة الدلالية بين ما يطلبه المستخدمون وما قمت بتخزينه. ...