Google baru saja menerbitkan panduan banger tentang rekayasa konteks yang efektif untuk sistem multi-agen. Perhatikan yang satu ini, pengembang AI! (tandai) Berikut adalah poin utama saya: Jendela konteks bukanlah hambatan. Rekayasa konteks adalah. Untuk masalah yang lebih kompleks dan jangka panjang, manajemen konteks tidak dapat diperlakukan sebagai masalah "manipulasi string" sederhana. Pendekatan default untuk menangani konteks dalam sistem agen saat ini tetap memasukkan semuanya ke dalam prompt. Lebih banyak sejarah, lebih banyak token, lebih banyak kebingungan. Sebagian besar tim memperlakukan konteks sebagai masalah penggabungan string. Tetapi dump konteks mentah menciptakan tiga kegagalan kritis: > ledakan biaya dari informasi yang berulang > penurunan kinerja dari efek "hilang di tengah" > peningkatan tingkat halusinasi ketika agen salah mengaitkan tindakan di seluruh sistem Manajemen konteks menjadi masalah arsitektur di samping penyimpanan dan komputasi. Ini berarti bahwa transformasi eksplisit menggantikan penggabungan string ad-hoc. Agen menerima konteks minimum yang diperlukan secara default dan secara eksplisit meminta informasi tambahan melalui alat. Tampaknya Agent Development Kit Google benar-benar berpikir secara mendalam tentang manajemen konteks. Ini memperkenalkan arsitektur berjenjang yang memperlakukan konteks sebagai "tampilan yang dikompilasi di atas sistem stateful" daripada aktivitas pengisian prompt. Seperti apa ini? 1) Struktur: Model Berjenjang Kerangka kerja memisahkan penyimpanan dari presentasi di empat lapisan berbeda: 1) Konteks Kerja menangani tampilan per pemanggilan sementara. 2) Sesi memelihara log peristiwa yang tahan lama, menangkap setiap pesan, panggilan alat, dan sinyal kontrol....