這些模型在 Patio11-As-A-Service 上變得非常出色。 (我經常收到電子郵件,這些郵件要麼請求類似於申訴專員的介入,要麼是關於作為消費者與金融行業互動的建議。有時為了檢查 SOTA,我會將事實輸入模型中。)
代表性範例: 用戶:Will(五段解釋)可能會讓我的帳戶被關閉嗎? 我,對自己說:非常不可能,有四個主要原因。 我,對模型說:我會如何回覆這位用戶,以及(分開)評論實際的真相。
模型:這裡有75%的對齊度,關於你在我尚未看到的電子郵件中實際描述的內容,以及95%的對齊度,關於對真實情況的看法。
某些模型可能更適合我特別運行這個查詢,而不是直接使用,因為除了我的互聯網語料庫和其他訓練數據外,它們還擁有例如許多相似電子郵件和 BAM 草擬會議的私人記憶。
但我感到欣慰的是,即使在沒有記憶的情況下,根據我隨意的實驗以及目前數十人向我報告的情況,"它們開箱即用的效果相當不錯。"
(這不是一個請求,請向我發送類似於申訴專員的問題,但考慮到世界無論我的就業或對此事的看法如何,仍然繼續這樣做,而我仍然希望人們在與金融行業的接觸中獲得公正的結果,我將繼續關心。)
(我在二十多歲時花了大量時間為人們免費寫信給銀行,而到了四十多歲,生活和職業的責任使這幾乎不再可行,但我很高興現在有一種幾乎無限可擴展的技術可以做到這一點。)
閒聊評論:有些人在各種監管機構擔任或多或少的全職工作,做著類似的工作,可能在他們的集體收件箱中有更多令人沮喪的電子郵件(由於技能水平的差異等,對於一般公眾而言)。
這項工作的很大一部分是在受監管的金融機構中走訪電話樹(或紙質等效物),以使他們更加關注迄今為止客戶的關切。 人們可以*想像*一位監管者決定,也許這應該是增強型的LLM。
有各種各樣的原因解釋為什麼沒有人會在2025年立即啟用這個,但我不認為這些原因會無限期地佔上風。
@michael_nielsen 手工版的說法是「一個名字可以,讓我們說作為一個例子的喚起,成為思想空間中的一個指標。」 LLM版的說法是「不,真的,這非常有幫助,看看權重。」
@michael_nielsen 除了人以外,我認為作品也可能是這方面的魔法咒語。"像國家一樣看"對許多科技人員來說意義重大,即使他們從未真正閱讀過德國森林管理的相關內容,而大型語言模型(LLM)也能跟隨這個指引。
@michael_nielsen 生活在這樣的時代真是太美好了,辛勤工作的回報就是向宇宙說出一個新的咒語。這不僅僅是富有表現力的描述,而是「不,人類整體,甚至可能是永恆,都可以簡單地複製那個咒語。」
13.31K