"Тобі варто частіше використовувати Bash." За останні кілька тижнів Thariq з Anthropic провів конференц-дзвінки з десятками компаній, які виробляють універсальні агенти. Помічники електронної пошти, боти для обслуговування клієнтів, управління розкладом — існує безліч форм для продуктів. Після деякого часу розмови він знову й знову повторював одне й те саме речення. Баш? Хіба це не командний інструмент для програмістів, і яке це має відношення до цих продуктів? Давайте спочатку розглянемо конкретний сценарій. Припустимо, у вас є агент електронної пошти, і ви запитуєте його: «Скільки я витратив на таксі цього тижня?» ” Традиційний підхід такий: агент викликає API, щоб отримати лист, може отримати 100 листів одночасно, а потім просити модель знайти чеки від Uber і Lyft, підсумовуючи суму. Проблема в тому, що 100 повідомлень втиснуті в контекст, і модель має запам'ятати їх одночасно, фільтрувати та обчислювати. Це нелегко для великих мовних моделей. Його легко пропустити, легко зробити помилки, і ви не можете перевірити, які листи читають. Це типова проблема зони комфорту моделей: обсяг даних недостатньо великий для обробки спеціальною програмою, але він виходить за межі можливості моделі виконувати одноразові жорсткі обчислення. Опинившись посередині, це незручно. Рішення Thariq — надати агенту інструмент Bash і дозволити йому зберігати проміжні результати у вигляді файлу. Звучить просто, але логіка цікава. Традиційний виклик інструменту виглядає так: Інструмент → моделі обробляє → вихід Усі проміжні стани знаходяться в «мозку» моделі, який ви не можете побачити і перевірити. Після переходу на Bash процес змінився: Інструменти → файлів збереження→ пошуку/фільтрації → обробки моделей → результатів виводу ...