熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
來自 X 賬號 TestingCatalog 的爆料:Google 在 Gemini 企業版(Gemini Enterprise)裡新增多智能體「自動做研究」模式
Google 正在 Gemini for Enterprise 裡打造一個多智能體系統。你給它一個主題,再配上一套評估標準,它就能自己生成一大堆點子,然後拉起一整支智能體團隊,像打錦標賽一樣一輪輪評審這些點子。
這個系統一次可以連續幹活大約 40 分鐘。對一個面向普通企業用戶的產品來說,這已經是非常長的一次連續推理過程了。
在這 40 分鐘結束時,用戶會收到一大串點子清單,按你一開始設定的標準從優到劣排好名。整個規模也不小:系統一次能產出大約 100 個點子。對每一個點子,你都能拿到:
- 一個概覽
- 一個更詳細的說明
- 一份點評總結
- 一份完整長評
- 以及一份專門的「錦標賽表現報告」(tournament performance report)
這個「表現報告」還是一個單獨的輸出,可以單獨打開慢慢看。所有生成出來的點子都是可選擇的,你可以點進任意一個,繼續深入展開。
在當前的內測版本裡,Google 看起來內置了三個智能體,其中有兩個就是搭在這個多智能體「錦標賽」系統之上的。
第一個叫 “Idea Generation”(創意生成)
在這個模式裡,你只要給一個主題,這個智能體就會啟動整套多智能體工作流,用「錦標賽式評估」(tournament-style evaluation)來生成和排序各種相關點子。(所謂錦標賽式,就是不斷讓方案互相“對決”,勝出的留下,弱的被淘汰)
第二個叫 “Co-scientist”(聯合科學家)
這個則更偏向科研和研究場景。你可以指定一個研究主題,再提供一些額外數據,然後一整個智能體團隊會先生成研究方向和方案,再用同樣的錦標賽機制去評估這些想法,只是這次會更強調科研和科學探索的需求。
這裡最有意思的一點,是它背後明顯投入了非常誇張的算力。允許智能體在一個任務上連續工作大約 40 分鐘,這在現在的大多數智能體工具裡都算是「豪華配置」了。
在整個 40 分鐘裡,系統會不斷迭代這個問題,不停生成、篩選、打分、重組。目前,這一切都還只出現在 Gemini for Enterprise 裡,屬於內部開發階段,對普通用戶是隱藏的,還沒有以正式功能形式對外開放。
跟現有的智能體實現相比,這一套看起來是個明顯的前進一大步。就算是那些已經帶瀏覽器模式的高級智能體,通常也會受限於上下文窗口和時間預算(time budget)。...
熱門
排行
收藏

