Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
95% инженерии ИИ — это просто инженерия контекста.
Все одержимы лучшими моделями, в то время как контекст остается настоящим узким местом.
Даже лучшая модель в мире даст вам мусор, если вы передадите ей неправильную информацию.
Вот что большинство людей упускает:
Инженерия контекста — это не только RAG или память или агенты. Это искусство и наука предоставления правильной информации, в правильном формате, в нужное время вашему LLM.
Подумайте о том, что вам действительно нужно:
↳ Извлечение для получения релевантных документов
↳ Краткосрочная память для отслеживания разговоров
↳ Долгосрочная память для запоминания предпочтений пользователя
↳ Агенты для координации всего
↳ Инструменты для расширения возможностей
Это 5 различных систем, которые вам нужно построить, соединить и поддерживать.
Я недавно работал с Pixeltable, и это интересный подход к этой проблеме. Это с открытым исходным кодом и рассматривает инженерию контекста как единую проблему данных:
Идея проста: вместо того чтобы соединять векторную базу данных, SQL базу данных, сервис встраивания и фреймворк агентов, все живет в одной системе.
Ваши документы, встраивания, история разговоров и выходы агентов — это все просто таблицы. Встраивания — это вычисляемые столбцы, которые обновляются автоматически. Векторный поиск работает наряду с вашими обычными операциями с данными.
Что я нахожу полезным:
↳ RAG конвейеры без управления отдельными базами данных
↳ Долгосрочная память через векторный поиск по историческим разговорам...

Топ
Рейтинг
Избранное

