95 % de l'ingénierie AI consiste simplement en ingénierie de contexte. Tout le monde est obsédé par de meilleurs modèles alors que le contexte reste le véritable goulot d'étranglement. Même le meilleur modèle au monde vous donnera des résultats médiocres si vous lui fournissez les mauvaises informations. Voici ce que la plupart des gens manquent : L'ingénierie de contexte ne concerne pas seulement RAG ou la mémoire ou les agents. C'est l'art et la science de fournir la bonne information, dans le bon format, au bon moment, à votre LLM. Pensez à ce dont vous avez réellement besoin : ↳ Récupération pour obtenir des documents pertinents ↳ Mémoire à court terme pour suivre les conversations ↳ Mémoire à long terme pour se souvenir des préférences des utilisateurs ↳ Agents pour orchestrer le tout ↳ Outils pour étendre les capacités Ce sont 5 systèmes différents que vous devez construire, connecter et maintenir. J'ai récemment travaillé avec Pixeltable, et c'est une approche intéressante à ce problème. C'est open-source et traite l'ingénierie de contexte comme un problème de données unifié : L'idée est simple : au lieu de rassembler une base de données vectorielle, une base de données SQL, un service d'embedding et un cadre d'agents, tout vit dans un seul système. Vos documents, embeddings, historique de conversation et sorties d'agents ne sont que des tables. Les embeddings sont des colonnes calculées qui se mettent à jour automatiquement. La recherche vectorielle fonctionne aux côtés de vos opérations de données habituelles. Ce que je trouve utile : ↳ Pipelines RAG sans gérer des bases de données séparées ↳ Mémoire à long terme grâce à la recherche vectorielle sur les conversations historiques...