分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

Boxでは、非構造化データで新しいモデルを使用してBox AIをテストし、実際の知識業務の分野で何がうまく機能するかを確認することに多くの時間を費やしています。ベンチマークからわかるように、GPT-5 は、推論、数学、論理、コーディング、その他の作業分野で GPT-4.1 よりも有意義な能力の向上を提供します。これらの改善が現実世界でどのような影響を及ぼすかの例をいくつか示します。 *GPT 5 は情報をより適切にコンテキスト化します。通貨ラベルのないが、住所がロンドンにある請求書の最終的な米ドル金額などのデータ抽出を行うと、GPT 5 は米ドルからポンドへの換算レートが必要と正しく応答します。これに対し、GPT 4.1 は最終的な請求書を見て、通貨を (誤って) 想定して返しました。 * GPT-5 は、より優れたマルチモーダル分析を提供します。公開会社の年次申告では、GPT-5 は、会社の株式構成要素の変化を示す画像からテーブル内のセルを分離するよう求められます。表の上部には、すべての株式額が千単位であることが明確に示されており、GPT-5 にはこの変換が明確に記載されていますが、GPT-4.1 には記載されておらず、表に株式と表示され、凡例に株式と記載されているため混乱しています。 * GPT-5 は、高レベルのプロンプトとデータの複雑さでより優れたパフォーマンスを発揮します。履歴書のすべての開始日、役職名、雇用主名のデータ抽出を行うと、GPT-5 はすべてのデータを引き出すことができましたが、GPT-4.1 はプロンプトのサイズと文書の複雑さを考えると、圧倒され、同じフィールドを抽出しませんでした。 * GPT-5 は、その回答がはるかに明確で明確です。明示的に議論された 6 つの異なるサービスとのアウトソーシング契約では、「契約内の 5 つの特定のサービス」について尋ねられた場合、GPT-5 は最初の 5 つを返し、6 番目のサービスについて尋ねなかったのは意図的だったかどうかを尋ねます。それに比べて、GPT-4.1 はそれ以上の警告なしに最初の 5 つを返すだけであり、ユーザーに下流の混乱をもたらす可能性があります。 * GPT-5は、複雑な分野でのデータ解釈に優れています。免疫学で通常使用されるフローサイトメトリーチャートの場合、GPT-5は高い割合の死細胞を正しく識別し、状況につながる可能性のあるもっともらしい根本原因を示しましたが、GPT-4.1は最小限の推論を提供し、生データから推測するにはさらなる確認が必要でした。 * GPT-5 は、コード内の不整合をより適切に特定できます。特定の Python コードファイル内の問題を特定するように求められた場合、GPT-5 と 4.1 はどちらも誤動作につながる実際のエラーを特定できますが、プログラムのコンテキストでは意味をなさないときに間違った変数を出力するなど、より微妙な問題を推測できたのは GPT-5 だけでした。より長いコンテキストウィンドウでの数学、推論、ロジック、応答の品質におけるこれらの改善は、日常業務のエンドユーザーにとって非常に役立ちますが、特に各ステップで情報を検証する人間がループにいない場合、より長く実行されるAIエージェントではさらに顕著になります。これらの改善が最新の AI モデルで継続的に行われていることは素晴らしいことです。

77.95K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable