Van het X-account TestingCatalog: Google heeft een nieuwe modus "Automatisch Onderzoek Doen" toegevoegd aan Gemini Enterprise. Google bouwt een multi-agent systeem in Gemini for Enterprise. Je geeft het een onderwerp en een set beoordelingscriteria, en het kan zelf een heleboel ideeën genereren, waarna het een heel team van agenten kan samenstellen om deze ideeën in rondes te beoordelen, net als in een toernooi. Dit systeem kan ongeveer 40 minuten achtereen werken. Voor een product dat gericht is op gewone zakelijke gebruikers is dit al een zeer lange aaneengeschakelde redeneerperiode. Aan het einde van deze 40 minuten ontvangt de gebruiker een lange lijst met ideeën, gerangschikt van best naar slechtste op basis van de door jou ingestelde criteria. De schaal is ook niet klein: het systeem kan ongeveer 100 ideeën tegelijk genereren. Voor elk idee ontvang je: - Een overzicht - Een meer gedetailleerde uitleg - Een samenvatting van de beoordeling - Een volledige lange beoordeling - En een speciale "toernooi prestatie rapport" (tournament performance report) Dit "prestatie rapport" is ook een aparte output die je afzonderlijk kunt openen en rustig kunt bekijken. Alle gegenereerde ideeën zijn selecteerbaar, je kunt op elk idee klikken om verder uit te diepen. In de huidige bètaversie lijkt Google drie agenten ingebouwd te hebben, waarvan er twee zijn gebaseerd op dit multi-agent "toernooi" systeem. De eerste heet "Idea Generation" (Idee Generatie). In deze modus hoef je alleen maar een onderwerp te geven, en deze agent zal de hele multi-agent workflow starten, gebruikmakend van "toernooi-stijl evaluatie" om verschillende gerelateerde ideeën te genereren en te rangschikken. (Toernooi-stijl betekent dat voorstellen voortdurend tegen elkaar "strijden", de winnaars blijven over en de zwakkere worden geëlimineerd.) De tweede heet "Co-scientist" (Co-wetenschapper). Deze is meer gericht op onderzoeks- en wetenschappelijke scenario's. Je kunt een onderzoeksonderwerp specificeren en wat extra gegevens geven, waarna een heel team van agenten eerst onderzoeksrichtingen en voorstellen genereert, en vervolgens dezelfde toernooi-mechanisme gebruikt om deze ideeën te evalueren, maar deze keer met meer nadruk op de behoeften van onderzoek en wetenschappelijke exploratie. Het meest interessante hier is dat er duidelijk een enorme rekenkracht achter is gestoken. Het toestaan van agenten om ongeveer 40 minuten aan een taak te werken, wordt in de meeste huidige agent-tools als een "luxe-configuratie" beschouwd. Gedurende die 40 minuten zal het systeem voortdurend het probleem itereren, ideeën genereren, filteren, scoren en herschikken. Tot nu toe is dit alles alleen beschikbaar in Gemini for Enterprise, in de interne ontwikkelingsfase, en is het verborgen voor gewone gebruikers; het is nog niet officieel beschikbaar gesteld. In vergelijking met bestaande agent-implementaties lijkt dit een duidelijke stap vooruit. Zelfs die geavanceerde agenten met browser-modus zijn meestal beperkt door contextvensters en tijdsbudgetten....