Senaste nytt från X-kontot TestingCatalog: Google har lagt till ett multiagent "automatiskt forsknings"-läge i Gemini Enterprise (Gemini Enterprise). Google bygger ett multiagentsystem i Gemini for Enterprise. Du ger det ett ämne, lägger sedan till en uppsättning utvärderingskriterier, och det kan generera många idéer på egen hand, och sedan samlar du ihop ett helt team agenter för att granska dessa idéer omgång för runda som en turnering. Detta system kan fungera kontinuerligt i cirka 40 minuter åt gången. För en produkt för den genomsnittliga företagsanvändaren är detta redan en mycket lång kontinuerlig resonemangsprocess. I slutet av de 40 minuterna får användarna en lista med idéer, rankade från bäst till sämst enligt de kriterier du satte i början. Hela skalan är inte liten: systemet kan producera cirka 100 pips åt gången. För varje idé får du: - En översikt - En mer detaljerad beskrivning - En sammanfattning av recensionen - En fullständig, lång recension - och en särskild "turneringsrapport" Denna "prestandarapport" är också en separat utgång, som kan öppnas separat och ses långsamt. Alla genererade idéer är valfria, och du kan klicka på vilken som helst för att fortsätta gräva djupare. I den nuvarande slutna betaversionen verkar Google ha tre agenter inbyggda, varav två är byggda ovanpå detta multiagent-"turnerings"-system. Den första kallas "Idégenerering" I detta läge ger du ett ämne och agenten startar ett arbetsflöde med flera agenter som använder en "turneringsliknande utvärdering" för att generera och rangordna relevanta idéer. (Den så kallade mästerskapsstilen är att ständigt låta scheman "duellera" mot varandra, vinnaren stannar kvar och den svaga elimineras) Den andra kallas "Medforskare" Den här är mer benägen att föredra vetenskaplig forskning och forskningsscenarier. Du kan utse ett forskningsämne, tillhandahålla ytterligare data, och sedan kommer ett helt team av agenter att utveckla forskningsinriktningar och lösningar, och sedan utvärdera dessa idéer med samma turneringsmekanism, men denna gång med större fokus på behovet av vetenskaplig forskning och vetenskaplig utforskning. Den mest intressanta poängen här är att det uppenbarligen har en mycket överdriven datorkraft bakom sig. Att låta agenter arbeta kontinuerligt med en uppgift i cirka 40 minuter anses vara en "lyxkonfiguration" i de flesta agentverktyg idag. Under de 40 minuterna iterar systemet på denna fråga, genererar, filtrerar, poängsätter och omorganiserar. För närvarande finns allt detta endast i Gemini for Enterprise, som befinner sig i intern utvecklingsfas, dold för vanliga användare, och ännu inte har öppnats för allmänheten i form av officiella funktioner. Jämfört med befintliga agentimplementationer verkar detta vara ett betydande steg framåt. Även avancerade agenter som redan har webbläsarläge är ofta begränsade av kontextfönster och tidsbudgetar....