我認為我們開始看到的不僅僅是看起來有用的模型 它們實際上能夠完成事情。 到目前為止,AI 看起來非常有能力,但往往會感到沮喪 我認為通過 RLVR 進行 RL 擴展是有效的 這讓我感覺像是 90 年代初的互聯網:進展緩慢,然後迅速增長,然後突然變得非常有用。