|
AIの世界には最強は存在せず、より強いものだけが存在する。 AIスタートアップ企業Anthropicは本日、初のハイブリッド推論モデル「Claude 3.7 Sonnet」を発表しました。これはClaudeシリーズの中で最も知能の高いモデルです。Claude 3.7 Sonnetは、ほぼ瞬時に応答を返すだけでなく、ユーザーに拡張的で漸進的な思考を提供します。APIユーザーは、モデルの思考時間をきめ細かく制御することもできます。 ハイブリッド推論とは、Claude 3.7 Sonnetが通常のモデルのように瞬時に応答すると同時に、拡張モードで段階的な推論を実行する機能を指します。このプロセスにより、より高品質な回答が得られ、より複雑なタスクを完了することが可能になります。簡単に言えば、Claude 3.7 Sonnetは通常のLLMと推論モデルを組み合わせたもので、DeepSeek V3とDeepSee R1のハイブリッドに似ています。 Anthropicはブログ投稿で、Claude 3.7 Sonnetの開発哲学が市場の他の推論モデルとは異なることを指摘しました。人間が素早い反応と深い思考の両方を一つの脳で実現するのと同様に、Anthropicは推論も完全に独立したモデルではなく、最先端モデルの包括的な機能であるべきだと考えています。この統合アプローチは、より完璧なユーザーエクスペリエンスをもたらすことも可能にします。 これまで、OpenAIのo1推論モデルとGPT-4o大規模言語モデル、そして中国のDeepSee R1推論モデルとDeepSeekv3大規模言語モデルは、それぞれ別々の製品として提供されていました。しかし、Claude 3.7 Sonnetでは、開発者は両方のモデルを単一のソフトウェアパッケージで使用できます。 複数の機能を単一モデルに統合することで製品を簡素化しているAI企業は、Anthropicだけではありません。今月初め、OpenAIの共同創設者兼CEOであるサム・アルトマン氏は、X(旧Twitter)で、待望のGPT-5を今年後半にリリースすると発表し、同社のGPTシリーズとoシリーズモデルを単一システムに統合することを明らかにしました。 Anthropicの前身となるフラッグシップモデルであるClaude 3.5 Sonnetは、2024年6月にリリースされ、その高度なプロフェッショナル向けコーディング機能が高く評価され、Replitなど、コーディング経験のないユーザー向けに設計された複数のアプリケーションのサポートに使用されました。そして今、新しいClaude 3.7 Sonnetモデルはさらに進化し、推論機能を統合しました。これは、人間の思考プロセスに類似したプロセスを用いて、問題を最も効果的に解決したり、クエリを処理したりする方法を「考える」ことができることを意味します。 Anthropicによると、Claude 3.5 SonnetはExtended Thinkingモードでは、質問に答える前に自己反省を行い、数学、物理学、命令トレース、コーディングなど、多くのタスクにおけるパフォーマンスを向上させます。さらに、API経由でClaude 3.7 Sonnetを使用する場合、ユーザーは思考予算を制御できます。思考時間はNトークンを超えないようにClaudeに指示しますが、Nの値は128Kトークンの出力制限に達する可能性があります。これにより、速度(およびコスト)と回答の質の間のトレードオフが可能になります。 アントロピック社は、推論モデルの開発において、数学およびコンピュータサイエンスの競技問題への最適化から、企業が実際にLLMをどのように使用しているかをよりよく反映した現実世界のタスクへと焦点を移したことを強調しました。これにより、新しいモデルの実用的な問題を解決する能力が向上しました。 上の図に示すように、Claude 3.7 Sonnet は、SWE-bench Verified (人工知能モデルが現実世界のソフトウェア問題を解決する能力を評価する) で優れた結果を達成しました。 上の図に示すように、Claude 3.7 Sonnetは、指示追従、一般推論、マルチモーダル機能、代理符号化において優れた性能を示し、数学と科学における拡張思考能力が大幅に向上しています。従来のベンチマークテストに加え、ポケモンゲームテストにおいても、この新モデルは従来のすべてのモデルを上回る性能を示しました。 Claude 3.7 SonnetのAPI価格はClaude 3.5 Sonnetから変更されていないようです。開発者は、入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドルを支払う必要があります。 Claude 3.7 Sonnetに加え、AnthropicはClaude Codeというプロキシコーディングツールもリリースしました。同社によると、このツールは「コードの検索と読み取り、ファイルの編集、テストの作成と実行、コードのコミットとGitHubへのプッシュ、そしてコマンドラインツールの使用が可能なアクティブなコラボレーター」として機能するとのことです。Anthropicによると、社内では既にこのツールをソフトウェアのデバッグ支援と開発負荷の軽減に活用しているとのことです。開発者は、GitHubリポジトリをAnthropicのコンシューマー向け製品であるClaude.aiに直接接続することもできます。 近年のAIの発展は目覚ましいものがあります。「日々変化している」という表現は控えめで、「毎週変化している」という表現の方が正確でしょう。Claude 3.7 Sonnetのリリースがなければ、今週オープンソースウィークを開催したDeepSeekに多くの人が注目していたかもしれません。Anthropicのハイブリッド推論における画期的な進歩は、既に熾烈な競争が繰り広げられているAI分野に、間違いなく新たな活力を与えました。この火がどれだけ長く、そしてどれだけ燃え続けるかは、AIが今後どのように現実世界のシナリオに実装されるかに大きく左右されます。 |