Z konta X, TestingCatalog, pojawiła się informacja: Google wprowadza nowy tryb „automatycznego badania” z wieloma agentami w Gemini Enterprise. Google tworzy system wieloagentowy w Gemini for Enterprise. Podajesz mu temat, a następnie zestaw kryteriów oceny, a on sam generuje mnóstwo pomysłów, a następnie uruchamia cały zespół agentów, aby w stylu turniejowym ocenić te pomysły. System może pracować nieprzerwanie przez około 40 minut. Dla produktu skierowanego do zwykłych użytkowników biznesowych, to już bardzo długi proces ciągłego rozumowania. Na koniec tych 40 minut użytkownik otrzyma długą listę pomysłów, uporządkowanych według ustalonych na początku kryteriów. Cała skala jest również znaczna: system może wygenerować około 100 pomysłów na raz. Dla każdego pomysłu otrzymasz: - przegląd - bardziej szczegółowy opis - podsumowanie recenzji - pełną recenzję - oraz specjalny „raport z występu w turnieju” (tournament performance report) Ten „raport z występu” jest osobnym wyjściem, które można otworzyć i przeglądać powoli. Wszystkie wygenerowane pomysły są do wyboru, możesz kliknąć dowolny z nich, aby dalej rozwijać. W obecnej wersji beta Google wydaje się mieć wbudowane trzy agenty, z których dwa opierają się na tym wieloagentowym systemie „turniejowym”. Pierwszy nazywa się „Idea Generation” (generowanie pomysłów). W tym trybie wystarczy podać temat, a ten agent uruchomi cały proces roboczy wieloagentowy, używając „oceny w stylu turniejowym” (tournament-style evaluation) do generowania i sortowania różnych powiązanych pomysłów. (Tzw. ocena w stylu turniejowym polega na ciągłym „konkurowaniu” pomysłów, gdzie zwycięskie zostają, a słabsze są eliminowane.) Drugi nazywa się „Co-scientist” (współnaukowiec). Ten jest bardziej ukierunkowany na badania i scenariusze naukowe. Możesz określić temat badawczy, a następnie dostarczyć dodatkowe dane, a cały zespół agentów najpierw wygeneruje kierunki badań i plany, a następnie oceni te pomysły za pomocą tej samej mechaniki turniejowej, z tym że tym razem większy nacisk kładzie się na potrzeby badań naukowych i eksploracji. Najciekawszym aspektem jest to, że za tym wszystkim stoi wyraźnie ogromna moc obliczeniowa. Pozwolenie agentom na ciągłą pracę nad jednym zadaniem przez około 40 minut to w większości obecnych narzędzi agentów „luksusowe wyposażenie”. W ciągu tych 40 minut system nieustannie iteruje nad problemem, generując, filtrując, oceniając i reorganizując. Na razie wszystko to występuje tylko w Gemini for Enterprise, jest w fazie wewnętrznego rozwoju, ukryte przed zwykłymi użytkownikami i nie zostało jeszcze udostępnione w formie oficjalnej funkcji. W porównaniu do istniejących realizacji agentów, ten zestaw wydaje się być wyraźnym krokiem naprzód. Nawet te zaawansowane agenty, które mają tryb przeglądarki, zazwyczaj są ograniczone przez okno kontekstowe i budżet czasowy (time budget)....