一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

來自 X 賬號 TestingCatalog 的爆料：Google 在 Gemini 企業版（Gemini Enterprise）裡新增多智能體「自動做研究」模式 Google 正在 Gemini for Enterprise 裡打造一個多智能體系統。你給它一個主題，再配上一套評估標準，它就能自己生成一大堆點子，然後拉起一整支智能體團隊，像打錦標賽一樣一輪輪評審這些點子。這個系統一次可以連續幹活大約 40 分鐘。對一個面向普通企業用戶的產品來說，這已經是非常長的一次連續推理過程了。在這 40 分鐘結束時，用戶會收到一大串點子清單，按你一開始設定的標準從優到劣排好名。整個規模也不小：系統一次能產出大約 100 個點子。對每一個點子，你都能拿到： - 一個概覽 - 一個更詳細的說明 - 一份點評總結 - 一份完整長評 - 以及一份專門的「錦標賽表現報告」（tournament performance report）這個「表現報告」還是一個單獨的輸出，可以單獨打開慢慢看。所有生成出來的點子都是可選擇的，你可以點進任意一個，繼續深入展開。在當前的內測版本裡，Google 看起來內置了三個智能體，其中有兩個就是搭在這個多智能體「錦標賽」系統之上的。第一個叫 “Idea Generation”（創意生成）在這個模式裡，你只要給一個主題，這個智能體就會啟動整套多智能體工作流，用「錦標賽式評估」（tournament-style evaluation）來生成和排序各種相關點子。（所謂錦標賽式，就是不斷讓方案互相“對決”，勝出的留下，弱的被淘汰）第二個叫 “Co-scientist”（聯合科學家）這個則更偏向科研和研究場景。你可以指定一個研究主題，再提供一些額外數據，然後一整個智能體團隊會先生成研究方向和方案，再用同樣的錦標賽機制去評估這些想法，只是這次會更強調科研和科學探索的需求。這裡最有意思的一點，是它背後明顯投入了非常誇張的算力。允許智能體在一個任務上連續工作大約 40 分鐘，這在現在的大多數智能體工具裡都算是「豪華配置」了。在整個 40 分鐘裡，系統會不斷迭代這個問題，不停生成、篩選、打分、重組。目前，這一切都還只出現在 Gemini for Enterprise 裡，屬於內部開發階段，對普通用戶是隱藏的，還沒有以正式功能形式對外開放。跟現有的智能體實現相比，這一套看起來是個明顯的前進一大步。就算是那些已經帶瀏覽器模式的高級智能體，通常也會受限於上下文窗口和時間預算（time budget）。...