熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Valerio Capraro
米蘭比科卡大學副教授。我寫的是關於社交行為和人工智慧的文章。
重磅預印本剛剛發布!
我們比較了人類和大型語言模型(LLMs)在七個認識論階段形成判斷的方式。
我們突出了七個斷層線,即人類和LLMs根本分歧的點:
基礎斷層:人類的判斷基於感知、具身和社會經驗,而LLMs僅從文本開始,間接地從符號重建意義。
解析斷層:人類通過整合的感知和概念過程解析情境;LLMs則進行機械的標記化,產生結構上方便但語義上薄弱的表示。
經驗斷層:人類依賴情節記憶、直觀的物理學和心理學以及學習的概念;LLMs僅依賴於嵌入中編碼的統計關聯。
動機斷層:人類的判斷受到情感、目標、價值觀和進化塑造的動機的指導;LLMs沒有內在的偏好、目標或情感意義。
因果斷層:人類使用因果模型、反事實和原則性評估進行推理;LLMs整合文本上下文而不構建因果解釋,而是依賴於表面相關性。
元認知斷層:人類監控不確定性、檢測錯誤並能夠暫停判斷;LLMs缺乏元認知,必須始終產生輸出,這使得幻覺在結構上無法避免。
價值斷層:人類的判斷反映身份、道德和現實世界的利害關係;LLM的“判斷”是沒有內在評價或問責的概率下一個標記預測。
儘管存在這些斷層,人類系統性地過度相信LLM的輸出,因為流利和自信的語言產生了可信度偏見。
我們認為這創造了一種結構性條件,稱為Epistemia:
語言的可信度取代了認識評估,產生了知道的感覺而實際上並不知道。
為了解決Epistemia,我們提出了三種互補策略:認識評估、認識治理和認識素養。
完整論文在第一條回覆中。
與@Walter4C和@matjazperc聯合發表

82
現在在《自然人類行為》上發表! 🚀🚀
在過去幾十年中,對集體人類行為的研究在很大程度上依賴於網絡。這是直觀的:人們與其他人互動。
然而,我們認為這一主導框架缺少了一個關鍵成分。
傳統網絡將代理表示為節點,將成對關係表示為邊。因此,它們基本上假設社會互動可以分解為成對的關係。
然而,許多社會過程是不可簡化為群體的。
一個簡單的例子:三位共同作者寫一篇論文的群體不能簡化為三對獨立的共同作者。這個群體本身是重要的。
在這篇文章中,我們回顧了許多實證和理論案例,其中群體互動無法分解為成對的互動,並展示了高階互動如何在超越二元關係的情況下塑造集體行為。
我們主張在超圖上研究集體行為,因為互動可以同時涉及多個代理。
我們回顧了超圖如何在多個領域提供新的見解,包括隸屬和合作網絡、高頻接觸環境(家庭、朋友)以及社會傳染、合作、說真話和道德行為等關鍵社會過程。
最後,我們概述了未來研究的有前景方向:解決高階模型的計算挑戰;研究群體動態中的偏見和不平等;結合超圖和大型語言模型來研究語言和行為的共同演化;以及使用高階網絡在實施前模擬政策的影響;等等。
我們對這項工作感到非常興奮,希望它能激發在這個快速增長且基本的領域進一步的研究,並具有廣泛的現實世界影響。
在第一條回覆中鏈接到論文
這項工作由Federico Battiston (@fede7j)出色地領導,並有一支傑出的共同作者團隊:Fariba Karimi (@fariba_k)、Sune Lehmann、Andrea Bamberg Migliano、Onkar Sadekar (@OnkarSadekar)、Angel Sanchez和Matjaz Perc (@matjazperc)

115
熱門
排行
收藏

