95% инженерии ИИ — это просто инженерия контекста. Все одержимы лучшими моделями, в то время как контекст остается настоящим узким местом. Даже лучшая модель в мире даст вам мусор, если вы передадите ей неправильную информацию. Вот что большинство людей упускает: Инженерия контекста — это не только RAG или память или агенты. Это искусство и наука предоставления правильной информации, в правильном формате, в нужное время вашему LLM. Подумайте о том, что вам действительно нужно: ↳ Извлечение для получения релевантных документов ↳ Краткосрочная память для отслеживания разговоров ↳ Долгосрочная память для запоминания предпочтений пользователя ↳ Агенты для координации всего ↳ Инструменты для расширения возможностей Это 5 различных систем, которые вам нужно построить, соединить и поддерживать. Я недавно работал с Pixeltable, и это интересный подход к этой проблеме. Это с открытым исходным кодом и рассматривает инженерию контекста как единую проблему данных: Идея проста: вместо того чтобы соединять векторную базу данных, SQL базу данных, сервис встраивания и фреймворк агентов, все живет в одной системе. Ваши документы, встраивания, история разговоров и выходы агентов — это все просто таблицы. Встраивания — это вычисляемые столбцы, которые обновляются автоматически. Векторный поиск работает наряду с вашими обычными операциями с данными. Что я нахожу полезным: ↳ RAG конвейеры без управления отдельными базами данных ↳ Долгосрочная память через векторный поиск по историческим разговорам...