Știri de ultimă oră de la contul X TestingCatalog: Google a adăugat un mod multi-agent "cercetare automată" în Gemini Enterprise (Gemini Enterprise). Google construiește un sistem multi-agent în Gemini for Enterprise. Îi dai un subiect, apoi adaugi un set de criterii de evaluare, iar acesta poate genera multe idei de la sine, apoi aduci o echipă întreagă de agenți să revizuiască aceste idei rundă cu rundă, ca într-un turneu. Acest sistem poate funcționa continuu aproximativ 40 de minute odată. Pentru un produs destinat utilizatorului mediu de întreprindere, acesta este deja un proces de raționament continuu foarte lung. La finalul celor 40 de minute, utilizatorii vor primi o listă de idei, clasate de la cele mai bune la cele mai slabe, conform criteriilor stabilite la început. Întreaga scară nu este mică: sistemul poate produce aproximativ 100 de pip-uri odată. Pentru fiecare idee, primești: - O prezentare generală - O descriere mai detaliată - Un rezumat al recenziei - O recenzie completă și lungă - și un "raport dedicat de performanță la turneu" Acest "raport de performanță" este și o ieșire separată, care poate fi deschisă separat și vizualizată lent. Toate ideile generate sunt opționale și poți da click pe oricare dintre ele pentru a continua să sapi mai adânc. În actuala versiune closed beta, Google pare să aibă trei agenți încorporați, doi dintre ei fiind construiti peste acest sistem multi-agent "turneu". Prima se numește "Generația Ideilor" În acest mod, dai un subiect, iar agentul începe un flux de lucru multi-agent care folosește o "evaluare de tip turneu" pentru a genera și clasifica idei relevante. (Așa-numitul stil de campionat este să lași constant schemele să se "dueleze" între ele, câștigătorul rămâne, iar cel slab este eliminat) Al doilea se numește "Co-științific" Acesta este mai orientat spre cercetare științifică și scenarii de cercetare. Poți desemna un subiect de cercetare, oferi date suplimentare, iar apoi o echipă întreagă de agenți va dezvolta direcții și soluții de cercetare, apoi va evalua aceste idei folosind același mecanism de turneu, dar de data aceasta cu un accent mai mare pe necesitatea cercetării științifice și a explorării științifice. Cel mai interesant aspect aici este că, evident, are o putere de calcul foarte exagerată în spate. Permițând agenților să lucreze continuu la o sarcină timp de aproximativ 40 de minute este considerat o "configurație de lux" în majoritatea instrumentelor pentru agenți de astăzi. Pe parcursul celor 40 de minute, sistemul ierat pe această problemă, generând, filtrând, notând și reorganizând. În prezent, toate acestea sunt doar în Gemini for Enterprise, care se află în stadiul de dezvoltare internă, ascuns utilizatorilor obișnuiți și nu a fost încă deschis publicului sub formă de funcții oficiale. Comparativ cu implementările existente ale agenților, acesta pare a fi un pas semnificativ înainte. Chiar și agenții avansați care au deja modul browser sunt adesea limitați de ferestre de context și bugete de timp....