اكتشفت أنني كنت أقوم بتصميم أدوات الذكاء الاصطناعي الخاصة بي للخلف. هنا مثال. كانت هذه سلسلة معالجة الرسائل الإخبارية الخاصة بي: قراءة رسائل البريد الإلكتروني ، والاتصال بمعالج الرسائل الإخبارية ، واستخراج الشركات ، ثم إضافتها إلى CRM. تضمن ذلك أربع خطوات مختلفة ، بتكلفة 3.69 دولارا لكل ألف رسالة إخبارية تتم معالجتها. قبل: سلسلة معالجة الرسائل الإخبارية (الصورة الأولى) ثم قمت بإنشاء أداة رسائل إخبارية موحدة جمعت كل شيء باستخدام Google Agent Development Kit ، إطار عمل Google لبناء أدوات وكيل الذكاء الاصطناعي من فئة الإنتاج: (الصورة الثانية) لماذا تعتبر أداة النشرة الإخبارية الموحدة أكثر تعقيدا؟ يتضمن إجراءات متعددة في واجهة واحدة (العملية ، البحث ، الاستخراج ، التحقق من الصحة) ، وينفذ إدارة الحالة التي تتعقب أنماط الاستخدام ونتائج ذاكرة التخزين المؤقت ، ولديها قيود على معدل مضمن ، وتنتج مخرجات JSON منظمة مع بيانات وصفية بدلا من النص العادي. ولكن هذا هو الجزء غير البديهي: على الرغم من كونها أكثر تعقيدا داخليا ، إلا أن الأداة الموحدة أسهل بالنسبة ل LLM لاستخدامها لأنها توفر مخرجات متسقة ومنظمة يسهل تحليلها ، على الرغم من أن هذه المخرجات أطول. لفهم التأثير، أجرينا اختبارات ل 30 تكرارا لكل سيناريو اختبار. تظهر النتائج تأثير الهيكل الجديد : (الصورة الثالثة) تمكنا من تقليل الرموز بنسبة 41٪ (p = 0.01 ، ذات دلالة إحصائية) ، مما ترجم خطيا إلى توفير في التكاليف. تحسن معدل النجاح بنسبة 8٪ (p = 0.03) ، وتمكنا من الوصول إلى ذاكرة التخزين المؤقت بنسبة 30٪ من الوقت ، وهو توفير آخر في التكاليف. بينما أنتجت الأدوات الفردية استجابات أقصر و "أنظف" ، إلا أنها أجبرت LLM على العمل بجدية أكبر لتحليل التنسيقات غير المتسقة. مكنت المخرجات المنظمة والشاملة من الأدوات الموحدة معالجة LLM بشكل أكثر كفاءة ، على الرغم من كونها أطول. اعتمد سير العمل الخاص بي على العشرات من أدوات Ruby المتخصصة للبريد الإلكتروني والبحث وإدارة المهام. كان لكل أداة واجهتها الخاصة ومعالجة الأخطاء وتنسيق الإخراج. من خلال تدميرها في أدوات التعريف ، يكون الأداء النهائي أفضل ، وهناك وفورات هائلة في التكاليف. يمكنك العثور على البنية الكاملة على GitHub.