Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
95% inżynierii AI to po prostu inżynieria kontekstu.
Wszyscy są obsesyjnie skupieni na lepszych modelach, podczas gdy kontekst pozostaje prawdziwym wąskim gardłem.
Nawet najlepszy model na świecie da ci śmieci, jeśli podasz mu błędne informacje.
Oto, co większość ludzi pomija:
Inżynieria kontekstu to nie tylko RAG, pamięć czy agenci. To sztuka i nauka dostarczania właściwych informacji, w odpowiednim formacie, w odpowiednim czasie, do twojego LLM.
Pomyśl o tym, czego naprawdę potrzebujesz:
↳ Retrieval, aby pobrać odpowiednie dokumenty
↳ Pamięć krótkoterminowa, aby śledzić rozmowy
↳ Pamięć długoterminowa, aby zapamiętać preferencje użytkownika
↳ Agenci, aby zorganizować wszystko
↳ Narzędzia, aby rozszerzyć możliwości
To 5 różnych systemów, które musisz zbudować, połączyć i utrzymać.
Ostatnio budowałem z Pixeltable i to interesujące podejście do tego problemu. Jest to open-source i traktuje inżynierię kontekstu jako zjednoczony problem danych:
Pomysł jest prosty: zamiast łączyć bazę danych wektorów, bazę danych SQL, usługę osadzania i ramy agentów, wszystko żyje w jednym systemie.
Twoje dokumenty, osadzenia, historia rozmów i wyniki agentów to wszystko po prostu tabele. Osadzenia to kolumny obliczeniowe, które aktualizują się automatycznie. Wyszukiwanie wektorowe działa obok twoich regularnych operacji na danych.
Co uważam za przydatne:
↳ RAG pipelines bez zarządzania oddzielnymi bazami danych
↳ Pamięć długoterminowa poprzez wyszukiwanie wektorowe w historycznych rozmowach...

Najlepsze
Ranking
Ulubione

