Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Система пам'яті ChatGPT дуже хороша, але вона споживає багато ресурсів. Як OpenAI забезпечує обслуговування 800 мільйонів користувачів? Хтось провів зворотне проектування системи пам'яті ChatGPT і виявив, що система пам'яті ChatGPT набагато простіша, ніж очікувалося. Немає векторної бази даних і RAG в історії чату. Натомість використовується чотири окремі рівні: Метадані сесії, адаптовані до вашого середовища, Чіткі факти довготривалого зберігання, Легкі підсумки останніх розмов, і розсувне вікно для поточної розмови. У цьому блозі детально розглянемо, як працює кожен рівень і чому цей підхід може бути кращим за традиційні системи пошуку.

У своїй основі це чотиришаровий контекстний стек. З кожною розмовою ШІ створює це «портфоліо», щоб одночасно впровадити всю ключову інформацію про вас у модель. Вона складається з чотирьох рівнів спільної роботи.

Перший шар — це тимчасова інформація про навколишнє середовище, така як ваш пристрій і місцезнаходження, яка зникає наприкінці сесії. Другий шар — це ваш постійний профіль, який зберігає ключові факти, які ви просите його запам'ятати.

Третій шар — це «вільна карта» ваших останніх інтересів, з лише коротким викладом назви чату, а не повним текстом. Внизу — повний запис поточної розмови, як ковзне вікно, що забезпечує миттєву послідовність. Що буде, якщо вікно заповнене?

Сенс ковзного вікна полягає в тому, що навіть якщо поточне вікно розмови «свайпає» через досягнення обмеження довжини, найраніше повідомлення видаляється, і ваші постійні спогади та недавні резюме інтересів залишаються збереженими. Це гарантує, що ШІ не «забуде» вас навіть під час довгих розмов.

Ця чотиришарова структура — перемога інженерної мудрості. Він досягає ідеального балансу між персоналізацією, продуктивністю та обчислювальними витратами, забезпечуючи найкращий користувацький досвід без потреби в найскладніших системах.

56,24K

Найкращі

Рейтинг

Вибране