HUOXIU

大規模モデルの差別化の傾向:より垂直的かつより専門的

侯宇著

編集者:羅青

今年に入ってから、大規模モデル市場では多様な製品が次々と登場し、産業界や学術界からは、今後の発展方向や差別化の動向について様々な意見が出ています。6月26日、世界インターネット会議における日山デジタル文明対話において、百度の創業者ロビン・リー氏とアリババクラウドインテリジェンスグループの会長兼CEOである張勇氏は、大規模モデルの発展方向に関する見解を改めて表明しました。

先日、テンセントの大型モデルも遅れて発表されました。記者会見では、テンセントクラウドとスマートインダストリーグループのCEOである唐道勝氏も業界に対する見解を述べました。

大型モデルの開発方向については、業界トップが以下のような基本的な合意に達しています。

  • 実体経済との融合は、大規模モデルの今後の発展の道筋です。クラウドベンダーは、金融、ヘルスケア、電力といった分野において、専門的な大規模モデルを構築し、垂直分野への大規模モデルの導入に取り組んでいます。
  • これらの主要モデルは決して一時的なトレンドではなく、人類の発展、世界経済成長の原動力、そして絶対に見逃すことのできない大きな戦略的機会に影響を与える重要な技術的変化です。
  • 大規模モデルは現在、世界的な技術革新の焦点であり、世界的な人工知能競争の主戦場となっていますが、ガバナンス上の課題も数多くもたらしています。

写真:ネット界の大物がニシャンに集結

以下は、インターネット大手による最近のスピーチの書き起こしです。

Robin Li: 大規模モデルはより多くの分野に浸透し、毎週反復されます。

大規模モデルはデジタル世界をどのように変えているのでしょうか?技術面と応用面の両方から議論したいと思います。

技術的な観点から見ると、IT 技術スタックは人工知能の時代に根本的な変化を遂げ、チップ、オペレーティング システム、アプリケーションの 3 層アーキテクチャから、チップ、フレームワーク、モデル、アプリケーションの 4 層アーキテクチャへと進化しました。

最下層はチップ層で、主流のチップはCPUからGPUへと移行しています。チップ層の上にはフレームワーク層があり、BaiduのPaddlePaddle、MetaのPyTorch、GoogleのTensorFlowといった主流のフレームワークが存在します。フレームワーク層の上にはモデル層があり、ChatGPTやWenxinの大規模モデルが存在します。大規模モデルはAI時代のオペレーティングシステムとなり、すべてのアプリケーションはそれらに基づいて開発されます。モデル層の上にはアプリケーション層があり、多様なネイティブAIアプリケーションが含まれます。

大規模モデルはますます多くの分野に浸透していくことが予測されます。大規模モデルを軸としたデジタル経済は、実体経済と深く融合し、実体経済を強化、最適化、拡大し、大きな付加価値を生み出し、経済社会の発展と産業に大きな変化をもたらすでしょう。

画像: 百度の創設者ロビン・リー

周紅一:公的所有の大規模モデルは業界の深みに欠けている

「人工知能の開発は『人間中心』であるべきです。大規模モデルは大規模なレイオフにつながるのではなく、従業員のスキルと効率性の向上に役立ち、使いやすいツールとなるべきです。」360グループの創業者である周紅一氏は、既存の公開大規模モデルの4つの欠点について初めて言及した。

まず、公開されている大規模モデルはジェネラリストである一方、業界特有の知識の深さが欠けています。 「以前はGPTはあらゆる知識を持っていると思っていましたが、業界の専門家であれば、セキュリティや金融といった垂直分野におけるGPTの知識の深さが不十分であることに気付くでしょう。多くの企業が自社の大規模モデルをトレーニングする際にこの特性に気づき、よりバランスの取れたものにするために、知識の深さを犠牲にしているのです」と周紅義氏は述べています。

彼は、垂直型大規模モデルが今後の重要な発展方向であると考えています。汎用モデルと様々な分野の独自の知識データを組み合わせることで、大規模モデルは「オールラウンダー」から「政府オールラウンダー」、「産業オールラウンダー」、「企業オールラウンダー」へと進化し、真の価値を生み出します。「最新のデータによると、GPT4も8つの垂直モデルで構成されていることが示されており、この見解を間接的に裏付けています。」

第二に、パブリックビッグデータモデルは企業内で内部データ漏洩を引き起こしやすいという問題があります。パブリックビッグデータモデルはローカルに展開されていないため、外部とのやり取りにおいてデータ漏洩のリスクが内在しています。また、パブリックビッグデータモデルでは内部権限の階層管理が不可能です。そのため、政府機関や企業によるパブリックビッグデータモデルの利用は、必然的にセキュリティリスクを伴います。

第三に、企業にとって、公開されている大規模モデルはコンテンツの真の信頼性を保証するものではありません。周紅義氏は、大規模モデルは「錯覚」に陥りやすく、これはしばしば「重大なナンセンス」と呼ばれ、誤った帰属につながることが多く、企業内の内部調査やナレッジベースによる修正が必要になると述べています。

第四に、公開されている大規模モデルではコスト管理が不十分です。彼は例を挙げました。多くの企業は大規模モデルをコーディングする能力さえあれば十分であり、数百億のデータポイントを持つ垂直型の大規模モデルで十分です。数千億のデータポイントを持つモデルを使用することは、リソースの無駄遣いになります。垂直型の大規模モデルはコスト管理において大きな利点があります。「一般知識」に基づいて独自の大規模モデルをトレーニングし、公開データでトレーニングした大規模モデルは、「半分の労力で2倍の結果」を達成できるため、企業のコスト削減と効率性の向上につながります

画像: 360グループの創設者、周紅義氏

張勇:今後は、さらに企業固有のモデルを作成していく予定です。

中国の人工知能(AI)発展は、強固な基盤、豊富な応用シナリオ、そしてデータと現実のシームレスな融合という3つの優位性を有しています。社会各界からの注目の高まりとイノベーションエコシステムの発展に伴い、これらの優位性は継続的に強化されています。デジタル化からインテリジェント化へと移行する中で、コンピューティングはインフラに不可欠な要素となっています。2009年、アリババクラウドは中国が独自開発したクラウドコンピューティングOSの最初のコードを書き、中国のクラウドコンピューティング時代を切り開きました。14年間の努力を経て、中国は世界第2位のコンピューティングパワー規模を達成し、コンピューティングパワー産業の年間成長率は約30%に達しています。アリババクラウドの目標は、高品質で高性能なコンピューティングパワーを提供し、「コンピューティングパワーをより身近に、AIをより広く普及させること」です。

アリババクラウドは今年4月、「Tongyi 1000 Questions」大規模モデルを公開テストに公開し、20万社以上の企業ユーザーからアクセスを申請されました。これは、ほぼすべての新興産業と伝統産業を網羅しています。同時に、アリババクラウドは業界パートナーと連携してイノベーションエコシステムを構築する「1000 Questions Partner Program」を立ち上げました。すでに石油・ガス、電力、運輸、金融、ホスピタリティ、エンタープライズサービス、通信などの業界をカバーしています。今後、より多くのエンタープライズ向けモデルを構築し、あらゆる業界がより迅速かつ効果的にインテリジェント化のメリットを共有できるよう支援していきます。

写真:アリババクラウドインテリジェンスグループ会長兼CEO、張勇氏

Tang Daosheng: 大規模モデルは業界特異性と精度に欠けており、データノイズが過剰になります。

人々は汎用モデルに大きな期待を抱いていますが、特定の業界のシナリオのニーズを満たす最適なソリューションではない可能性があります。

現在、汎用的な大規模モデルは、一般的に、公開されている広範な文献やオンライン情報に基づいて学習されています。しかし、オンライン情報には誤り、噂、バイアスが含まれる可能性があり、専門知識や業界データの蓄積が不足していることが多く、モデルの業界関連性と精度が不十分で、データの「ノイズ」が過剰になることがあります。しかし、多くの業界シナリオにおいて、ユーザーは企業が提供する専門的なサービスに高い期待を抱いており、誤りに対する許容度は低いです。不正確な情報を提供することは、重大な法的責任や広報上の危機につながる可能性があります。したがって、企業が使用する大規模モデルは、制御可能、追跡可能、修正可能でなければならず、実稼働前に繰り返し徹底的なテストを実施する必要があります。

実用性の高いインテリジェントサービスを構築するには、クライアントが業界特化型の大規模モデルと、トレーニングおよびファインチューニングのための自社データを組み合わせる必要があると考えています。企業が求めているのは、100のシナリオにおける70%~80%の問題を解くことではなく、現実世界のシナリオにおける具体的な問題を真に解決することです。

さらに、利用可能な学習データが増えるほど、モデルは大きくなり、学習と推論のコストが増大します。実際には、ほとんどのエンタープライズシナリオでは、ニーズを満たすために汎用的で包括的なAIは必要ないかもしれません。したがって、適切なモデルを合理的なコストで選択することは、エンタープライズクライアントが検討すべき重要な決定です。

次に、データについてお話しましょう。データは大規模モデルの原材料です。特定のシナリオにおいては、関連データのカバレッジと品質が極めて重要であり、ラベル付きデータの管理もモデルの反復処理において重要なタスクとなります。

最終的には、モデルを実際のシナリオに実装する必要があります。望ましいサービス成果を達成するには、企業独自のデータを活用することがしばしば必要になります。モデル開発プロセスにおいては、機密データの保護とセキュリティコンプライアンスに留意するとともに、大量のデータとタグを管理し、継続的にモデルをテストし、反復していくことが不可欠です。

次に、アプリケーションについてお話しします。テンセント独自のエンタープライズレベルのアプリケーションは、業界標準のモデルを積極的に適用し、さまざまなアプリケーションシナリオに対してよりインテリジェントなサービスを提供することで、ユーザーの作業効率を向上させています。

写真:テンセントクラウドおよびスマートインダストリーズグループのCEO、唐道生氏

最後に、コンピューティング能力についてお話しましょう。コンピューティング能力は、モデルの継続的な運用の基盤となります。高性能、高弾力性、そして高い安定性を備えたコンピューティング能力を実現するには、専門的なクラウドサービスの支援が必要です。

大規模モデルの学習と利用には、大量の異機種コンピューティング能力のサポートが必要であり、ネットワーク速度と安定性に対する要件も非常に高くなります。さらに、GPUサーバーは一般的なサーバーに比べて安定性が低く、サーバーのメンテナンスとトラブルシューティングの頻度も高くなるため、全体的なメンテナンスの難易度と作業負荷は大幅に高くなります。

振り返ってみると、人工知能の発展は、オープンデータの蓄積、アルゴリズムの革新、コンピューティング能力の飛躍的進歩の組み合わせによって推進されてきました。また、オープンソースコードと研究成果の共有を通じた、世界中のテクノロジー企業、大学、研究機関の共同の努力の結果でもあります。