你正在參加 Google 的 AI 工程師面試。 面試官問: 「我們的數據分散在幾個來源(Salesforce、Gmail、Drive 等) 你會如何構建一個統一的查詢引擎?」 你:「我會將所有內容嵌入到向量數據庫中並進行 RAG。」 面試結束! 許多開發者仍然認為上下文檢索是一個線性管道: Chunk → Embed → Retrieve → Generate 這對於簡單的演示效果很好,但生產系統需要根本不同的東西。 為了更好地理解,考慮這個查詢: 「將我們在芝加哥地區的 Q4 銷售表現與去年在與利益相關者會議中制定的預測進行比較。」 這個單一查詢需要: - 來自 SQL 數據庫的銷售數據 - 圖形關係(組織層級) - 對預測報告的向量搜索 - 基於時間的過濾(今年的 Q4 與去年) - 權限檢查(用戶授權) ...