熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
紐約客:人工智能的盈利困局與歷史教訓
作者:約翰·卡西迪
1987年,諾貝爾經濟學獎得主、麻省理工學院(M.I.T.)的羅伯特·索洛(Robert Solow)在《泰晤士書評》的一篇文章中評論道:“計算機時代隨處可見,唯獨在生產率的統計數據中不見蹤影。” 儘管當時計算能力飛速提升,個人電腦也日益普及,但政府數據卻顯示,衡量工資和生活水平的關鍵指標——工人的人均總產出——卻停滯了十多年。這就是後來著名的“生產率悖論”(productivity paradox)。這個悖論持續到了上世紀90年代甚至更久,引發了大量莫衷一是的學術研究。一些經濟學家將其歸咎於新技術管理不善;另一些人則認為,與蒸汽機和電力等早期發明相比,計算機在經濟上的重要性相形見絀;還有人則怪罪於數據統計有誤,認為修正後悖論便會消失。
索洛的文章發表近40年後,自OpenAI發佈ChatGPT聊天機器人近三年來,我們可能正面臨一個新的經濟悖論,而這次的主角是生成式人工智能(generative artificial intelligence)。根據斯坦福大學、克萊姆森大學和世界銀行的經濟學家最近進行的一項調查,在今年6月和7月,有近一半的勞動者(準確地說是45.6%)都在使用AI工具。然而,麻省理工學院(M.I.T.)媒體實驗室一個團隊的新研究卻報告了一個驚人的結果:“儘管企業在生成式AI上投入了300到400億美元,本報告發現95%的組織回報為零。”
該研究的作者們審查了三百多個公開的AI項目和公告,並採訪了五十多名公司高管。他們對“成功的AI投資”的定義是:已經超越了試點階段(pilot phase)並被實際部署,且在六個月後產生了可衡量的財務回報或顯著的生產率提升。他們寫道:“只有5%成功整合的AI試點項目正在創造數百萬美元的價值,而絕大多數項目仍停滯不前,對P&L(即‘損益表’,profit-and-loss)沒有任何可衡量的影響。”
調查採訪引發了一系列迴應,其中一些充滿了懷疑。“領英(LinkedIn)上炒得天花亂墜,好像一切都變了,但我們的實際運營中,根本性的東西一點沒變,”一家中型製造公司的首席運營官告訴研究人員。“我們處理合同是快了點,但僅此而已。” 另一位受訪者評論道:“我們今年看了幾十個演示。可能一兩個是真有用。剩下的要麼是‘套殼’(wrappers,指僅僅包裝了現有技術,沒有實質創新),要麼就是‘科學項目’(指離實際商業應用還很遠的技術探索)。”
公平地說,該報告也指出,確實有一些公司進行了成功的AI投資。例如,報告強調了針對後臺運營(back-office operations)的定製化工具所創造的效率,並指出:“這些早期結果表明,有學習能力的系統,如果針對特定流程,確實可以帶來真正的價值,甚至無需進行重大的組織結構調整。” 調查還提到一些公司報告稱“通過自動化外聯和智能跟進系統,提高了客戶保留率和銷售轉化率”,這表明AI系統可能對營銷有用。
但是,“許多公司正艱難地獲取實質性回報”這一觀點,與跨國諮詢公司Akkodis的另一項最新調查不謀而合。該公司聯繫了兩千多名企業高管後發現,對本公司AI實施策略“非常有信心”的CEO比例,已從2024年的82%驟降至今年的49%。企業首席技術官的信心也有所下降,儘管降幅沒那麼大。Akkodis的調查稱,這些變化“可能反映了先前在數字化或AI項目上令人失望的結果、實施中的延遲或失敗,以及對可擴展性(scalability)的擔憂。”
上週,媒體對麻省理工學院媒體實驗室研究的報道,恰逢英偉達(Nvidia)、Meta和 Palantir 等高估值的AI相關股票下跌。當然,相關性不等於因果關係,OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)最近的言論可能在這次拋售中扮演了更重要的角色(鑑於近期的價格漲幅,拋售在所難免)。據CNBC報道,奧爾特曼在一次與記者的晚宴上表示,目前的估值“高得離譜”(insane),並在15秒內三次使用了“泡沫”(bubble)一詞。
儘管如此,麻省理工學院的這份研究還是吸引了大量關注。在最初一輪新聞報道之後,有消息稱,與許多科技公司有聯繫的媒體實驗室正在悄悄限制對該報告的訪問。我留給該組織公關辦公室和兩位報告作者的信息都石沉大海。
儘管這份報告比一些新聞報道所描述的要微妙,但它無疑對2022年11月OpenAI發佈ChatGPT以來支撐科技繁榮的宏大經濟敘事提出了質疑。這個敘事的簡版是:生成式AI的廣泛傳播對工人(尤其是知識工作者)不利,但對公司及其股東卻極為有利,因為它將帶來生產率的巨大飛躍,並因此帶來豐厚利潤。
為什麼這一幕似乎還沒有發生?一個可能的原因讓人想起了上世紀八九十年代的一種觀點,即管理失誤限制了計算機帶來的生產力效益。媒體實驗室的研究發現,一些最成功的AI投資是由初創公司做出的,它們在工作流程的狹窄領域使用了高度定製化的工具。而在“生成式AI鴻溝”(GenAI Divide)的另一邊,那些不太成功的初創公司“要麼在構建通用工具,要麼試圖在內部開發能力”。報告更籠統地指出,成功與失敗的分野“似乎不是由模型質量或監管驅動的,而是由(實施)方法決定的。”
可以想象,生成式AI的新穎性和複雜性可能讓一些公司望而卻步。諮詢公司高德納(Gartner)最近的一項研究發現,只有不到一半的CEO相信他們的首席信息官“精通AI”。但對於媒體實驗室報告中凸顯的失望記錄,還有另一種可能的解釋:對於許多成熟企業而言,生成式AI(至少在目前的形式下)根本沒有被吹噓的那麼神。“它在頭腦風暴和撰寫初稿方面非常出色,但它記不住客戶的偏好,也不會從以前的編輯中學習,”媒體實驗室調查的一位受訪者說。“它會重複同樣的錯誤,每次會話都需要輸入大量上下文(context)。對於高風險的工作,我需要一個能夠積累知識並不斷改進的系統。”
當然,有很多人覺得AI很有用,也有學術證據支持這一點:2023年,麻省理工學院的兩位經濟學家發現,在一項隨機試驗中,接觸ChatGPT的參與者能更快地完成“專業寫作任務”,寫作質量也有所提高。同年,其他研究團隊也發現,使用Github的Copilot(一款AI編程助手)的程序員,以及使用了專有AI工具的客戶支持代理,都獲得了生產率提升。媒體實驗室的研究人員發現,許多員工正在工作中使用他們的個人工具,如GPT或Claude;報告將這種現象稱為“影子AI經濟”(shadow AI economy),並評論說“它帶來的投資回報率(ROI)”往往優於僱主發起項目。但問題依然存在,而且這肯定是公司高管們會更頻繁提出的問題:為什麼沒有更多的公司看到這些效益體現在最終的(公司)利潤中?
部分問題可能在於,生成式AI雖然引人注目,但在經濟的許多領域中應用有限。休閒和酒店業、零售業、建築業、房地產業和護理行業(照顧兒童、老人或體弱者)——這些行業總共僱傭了大約五千萬美國人,但它們看起來並不像是AI轉型的直接候選者。
...

熱門
排行
收藏

