Du är på en AI-ingenjörsintervju hos Google. Intervjuaren frågar: "Vår data är spridd över flera källor (Salesforce, Gmail, Drive, etc.) Hur skulle du bygga en enhetlig frågemotor ovanpå den?" Du: "Jag bäddar in allt i en vektordatabas och gör RAG." Intervjun är över! Många utvecklare tror fortfarande att kontexthämtning är en linjär pipeline: Chunk → Bädda in → hämta → generera Detta fungerar utmärkt för enkla demos, men produktionssystemen behöver något fundamentalt annorlunda. För att förstå bättre, överväg denna fråga: "Jämför vår försäljningsutveckling under fjärde kvartalet i Chicago-regionen med förra årets prognoser som formulerades vid ett möte med intressenter." Denna enda fråga kräver: - Försäljningsdata från din SQL-databas - Grafrelationer (organisatorisk hierarki) - Vektorsökning över prognosrapporter - Tidsbaserad filtrering (fjärde kvartalet i år jämfört med förra året) - Behörighetskontroller (för användarbehörighet) ...