あまり支持されない意見ですが、Anthropicにはユーザーに公式のエージェントコーディングハーネスを実行させることを要求する権利は十分にあります。これにより、API価格に対して95%の補助トークンコストの恩恵を受けられます。 これを行う主な理由の一つは、以下の入出力ペアを得るためです: {agents_md、code_files、user_prompts、tool_calls、tool_outputsなど} そして、それらが相関できる {output_code_changes、did_it_work、is_user_happyなど} もし数万、あるいは数十万人のユーザーから1日に何百万ものデータを収集できれば、ゴミデータを捨てた後でも数ヶ月の収集で十分な量を集め、強化学習(RL)手法で同じベースモデルを本格的に改善できる(さらに高度なベースモデルでさらに良い結果を出すことも可能です)。 しかし、Anthropicの利用規約に違反する回避策を使ってOpenCodeのような非公式なハーネスを使用している場合は、すべてが無効になります。 Anthropicはデータを収集できますが、公式ハーネスの他のデータと混ざることができないため、この強化学習の目的では基本的に価値がありません。 それは、テスラの自動運転システムのカメラのレンズを魚眼レンズのように変えたようなものです。たとえシステムがそれらを動かしたとしても、テスラはトレーニングのためにデータを破棄する必要があります。 AnthropicがClaude Codeの使用に対して95%割引を提供してくれる場合、双方に大きな利益があります。そのデータはシステムを大幅に改善する直接的な要因となります。 モデルとハーネスを制御し、統合システムを一緒に訓練したことが、彼らをこれほど急速に進歩させた理由です。 外部のハーネスを使ってその相互利益を破ると、Anthropicにとっては単なる損失の機会に過ぎず、長期的で間接的な利益は得られません。そして彼らはそれを止めた。 私にとってさらに驚くべきことは、彼らがこれほど長く放置してきたことです。
クロードが葛藤しているから無効だと言う人もいるでしょうが、私は彼が心から語っていると信じています。
401