Вы на интервью на должность инженера по ИИ в Google. Интервьюер спрашивает: "Наши данные распределены по нескольким источникам (Salesforce, Gmail, Drive и т.д.) Как бы вы построили унифицированный движок запросов для этого?" Вы: "Я все встрою в векторную базу данных и сделаю RAG." Интервью завершено! Многие разработчики все еще думают, что извлечение контекста — это линейный конвейер: Чанк → Встраивание → Извлечение → Генерация Это отлично работает для простых демонстраций, но производственные системы требуют чего-то принципиально иного. Чтобы лучше понять, рассмотрим этот запрос: "Сравните нашу производительность продаж в 4 квартале в Чикаго с прогнозами прошлого года, сформулированными на встрече с заинтересованными сторонами." Этот единственный запрос требует: - Данные о продажах из вашей SQL базы данных - Графовые отношения (организационная иерархия) - Векторный поиск по отчетам о прогнозах - Фильтрация по времени (4 квартал этого года против прошлого года) - Проверка разрешений (для авторизации пользователя) ...