なるほど、これはすでにリリースノートに載っているようです(確認しました)、だから...(注:モデルのテストは私の仕事の一部であり、この投稿はOpenAIのスポンサーではありません): 私はロボティクス、数学、免疫学、医学、音楽などの専門家と共にGPT-5.1 Proのアルファテストに招待されました。私の関心は生命科学、商業研究と戦略、そしていくつかの個人的なユースケースでした。 数日間GPT-5.1 Proを使ってみて、GPT-5 Proよりも人間の領域の専門家に近いと感じました。文章がより明瞭で判断力が良く、脱線が少なく、より強い総合力があり、感情に敏感な反応が求められます。 私はGPT-5.1 ProとGPT-5 Proを、科学文献の合成、薬剤ローンチ計画、ソーシャルメディア分析などの業務タスクで直接対決させました。個人の財務計画や日記の書き方にも試しました。そうでした: - 研究と計画においてより厳密かつ包括的であること。 - 理屈が得意だ。 - 軌道に乗らず、脱線(および少なくとも一つの場合に関連する誤り)を避ける能力が高い。 - コミュニケーションスタイルがずっと明瞭で自信に満ち、共感的になった。 OpenAIが実際のパフォーマンス(例:GDPval)に注力し、金融などの分野で専門家を採用しているという報告を踏まえると、人間の専門知識こそが彼らが目指しているものだと思いますし、GPT-5.1 Proでその可能性が高まっています。 とはいえ、すべてにおいて優れているわけではありません。それでもプロフェッショナル品質のプレゼンテーションやExcelのスプレッドシート作成は苦手で、OpenAIモデルの顕著な弱点の一つで、改善に取り組んでいるはずです。そして少なくとも一人のテスターは、モデルがSTEM分野の既知の未解決の問題に保守的に取り組むことを避け、なぜそれが未解決の問題であるのかを説明することを選んでいると感じました。 全体的に言えば、私が使う用途ではGPT-5 Proより10〜15%のジャンプがあると思います。これは、より優れた専門知識、直感、判断力を持ち、共感力やコミュニケーション能力も向上した、よりリアルな同僚のように考え、コミュニケーションをとるモデルへの一歩のように感じられます。 これは2026年にAIがさらに影響力のある仕事をする兆しです。