|
大規模モデルの急速な発展に伴い、業界にとっての核心的な問いは、「そもそも大規模モデルは存在するのか?」から「中国のAI業界は、その構築に積極的に投資した後、どのようにして大規模モデルの実装を実現できるのか?巨額の構築投資によって、どのようにして確実かつ持続可能な収益を生み出すことができるのか?」へと変化している。 実際、中国における AI の最も強力な特徴は常にその実用化でした。 テクノロジーの普及度を示す重要な指標の一つに、テクノロジー密度があります。これは、テクノロジーが社会や経済においてどの程度普及し、応用されているかを示すものです。ここ数年、AIテクノロジーは中国全土の農地、工場、港、鉱山、大学キャンパス、そして都市で急速に発展しており、これは世界の他の地域ではほとんど見られない現象です。 産業革命は一夜にして起こるものではありません。中国は、幅広いビジネスシナリオとAI導入の経験を有しており、大規模モデルの導入において先駆者となるべきです。 予想通り、中国における AI と大規模モデルの応用を取り巻く疑問や好奇心は、Wenxin の最新の開発によって解決できるようになりました。 7月6日、2023年世界人工知能大会(WAIC)で、百度(バイドゥ)最高技術責任者、深層学習技術・応用国家工程研究センター所長の王海鋒氏が文心ビッグモデルバージョン3.5の中核技術について説明し、PaddlePaddleエコシステムの最新の進捗状況を発表し、PaddlePaddle深層学習プラットフォームの最新データを公開し、人工知能産業モデルについて詳しく説明しました。 WenxinとPaddlePaddleの相乗的な発展は二重らせん構造を形成します。このDNA断片を理解することで、中国のAI技術がどのように実装され続けているのか、その方法と道筋をより明確に理解することができます。 I. 産業用AIの見えない壁 技術が産業に進出するには、技術的リーダーシップ、市場の需要、製品の信頼性と使いやすさという 3 つの要素が市場構造に影響を与える制約となります。 大規模モデル技術の最先端性と市場需要は疑いようがありません。しかし、その製品は業界ユーザーの厳しい審査に耐えられるでしょうか?中国には数多くのAIシナリオがあり、早期導入と豊富な実務経験があるため、産業AIの見えない壁は既に明らかです。様々な業界に蔓延する「三高」(高い要求、高い基準、高い効率)は、大規模モデルの導入を成功させるために克服すべき課題です。 高い能力要件。強固なIT基盤を持つ一部の業界は、AIをいち早く適用し、大規模モデルを導入するでしょう。しかし、これらの分野では複雑なビジネスシナリオや長年使用されてきた従来のアルゴリズムがしばしば存在します。そのため、これらの業界における大規模AIモデルの基本能力は非常に高く、アップグレードや置き換えが必要になる前に、既存の技術手段の限界を超えてしまう可能性があります。 高度な専門知識が必要です。汎用的な大規模モデルを垂直に細分化されたビジネスシナリオに適用すると、非常に複雑なビジネス状況に直面することになります。課題や詳細、必要なデータ、そして目的を注意深く把握する必要があります。大規模モデルは、業界の専門家のように、独自の知識と業界のノウハウを習得できる必要があります。 開発コストは高額です。業界シナリオの複雑さと多様性により、大規模モデルの導入には、ターゲットを絞ったトレーニングと微調整が必要です。しかし、多くの業界や企業では、カスタマイズされた開発に必要なIT人材とコンピューティングリソースが不足しており、大規模モデルの導入が遅れています。 「3高」(高効率、高コスト、高品質)の要件は、AI技術の実装を制限しており、大規模モデルがまだ業界に参入する初期段階にあることも意味しています。 II. 中国の大規模モデルの実践例 産業AIの障壁を打ち破るには、強力なツールが必要です。世界人工知能会議において、王海鋒氏は文心ビッグモデル3.5の中核技術革新について発表しました。 文鑫ビッグモデル3.0と比較して、文鑫ビッグモデル3.5は効果、機能、性能の面で全面的に改善され、基本モデルのアップグレード、微調整技術の革新、知識ポイントの強化、論理的推論の強化などの機能の向上を実現しました。 さらに注目すべきは、応用レベルでは、文心ビッグモデルが制約を打ち破り、実用化への道を開く一連の方法を示しており、業界モデルとして役立つ可能性があることです。 Wenxin の大型モデル 3.5 の主要な技術革新は、業界のさまざまな分野からの大型モデルに対する 3 つの強い期待を満たしています。 まず、高度な生産力への期待があります。 最終的には、大規模モデルは信頼性が高く、利用可能でなければ、業界の効率性と有効性を向上させることはできません。Wenxinの大規模モデル3.5における2つの主要なアップグレードは、この点に重点を置いています。 まず、基本モデルをアップグレードし、PaddlePaddleをベースとしたモデル反復を加速することで、モデルの性能とセキュリティを向上させました。同時に、百度文心大規模モデル研究開発チームは、多種類・多段階の教師ありファインチューニング、多階層・多粒度報酬モデル、マルチロス関数ハイブリッド最適化戦略、デュアルフライホイール結合モデル最適化などの技術革新を行い、モデルの性能とシーン適応性をさらに向上させました。 さらに、Wenxinの大規模モデル3.5は、論理的推論能力が強化され、意味理解、数学的計算、コード生成といった、実世界のビジネスオペレーションで頻繁に発生するタスクの領域において、より優れたパフォーマンスを発揮します。Wang Haifeng氏は、Baiduには多くのエンジニアが毎日コードを作成しており、Wenxinの大規模モデルのコード生成機能は、エンジニアのコーディング効率を向上させ、生産性を効果的に向上させるのに役立つと例を挙げました。 第二に、業界の専門家に対する期待があります。 ビジネスにおけるより専門的な実務問題を解決するには、大規模モデルを業界のシナリオに適応させる必要があるという認識が広まっています。バージョン3.5では、「ファインチューニング」と「ナレッジポイントの拡張」という2つの主要な技術革新により、大規模モデルが業界の専門家の専門能力を備えることが可能になります。 教師あり微調整技術は、特定のビジネスシナリオに合わせて調整できるため、結果の信頼性が向上し、モデルのパフォーマンスとセキュリティに関するビジネスシナリオのニーズをより適切に満たすことができます。知識拡張技術は、以前の知識と検索機能の強化に基づいて構築され、より具体的で詳細かつ専門的な知識ポイントを大規模モデルに注入することで、世界知識の習得と応用を大幅に向上させ、専門的なタスクをより適切に完了できるようにします。例えば、レポートを生成する際に、Wenxin大規模モデルはユーザー入力のクエリや質問を分析・理解し、回答を生成するために必要な関連知識ポイントを解析することで、ビジネスの特性により適合したコンテンツを生成します。 第三に、応用範囲の拡大が期待されます。 スマートフォン上の豊富なアプリケーションは、モバイルインターネット業界の繁栄の前提条件です。大規模アプリケーションのユーザーは、多様で豊富かつ使いやすいツールを求めており、プラグインメカニズムが不可欠です。 Wenxin Big Model 3.5の新しいプラグインメカニズムは、ビッグモデルの機能を拡張し、様々なシナリオに詳細かつ効率的に適用できます。例えば、Wenxin Yiyanの長文要約・質問応答プラグイン「ChatFile」は、超長文入力に対応し、オフィス環境における会議の議題、要約、結論などの重要な情報を生成し、業務効率の向上に貢献します。 王海鋒氏はまた、文心易言はユーザーが文心ビッグモデルをより有効に活用できるよう、Baidu公式プラグインとサードパーティ製プラグインをさらに高品質にリリースしていくと述べた。同時に、プラグインエコシステムを段階的に開放し、開発者が文心ビッグモデルをベースに独自のアプリケーションを構築できるよう支援していく。 多数の優秀な開発者やソフトウェアエンジニアが Wenxin ビッグモデルに基づいてカスタムプラグインを作成することで、ビッグモデルの使いやすさと業界への適応性がさらに向上するだけでなく、結果として得られるアプリケーション市場スペースも巨大になります。 Wenxin Grand Model 3.5のアップグレード曲線は業界の期待とほぼ一致しています。これは、Wenxin Grand Modelが常に様々な業界で導入可能であることを示しています。 第三に、大規模モデルの実装には持続可能な勢いが必要です。 大型モデルだけでは不十分です。王海鋒氏は、文鑫易言のような大型モデル産業の実現過程において、「集約型生産・プラットフォーム応用」モデルを採用することを提案しました。つまり、アルゴリズム、コンピューティング能力、データといった総合的な優位性を持つ企業が、複雑なモデル生産プロセスをカプセル化し、敷居が低く高効率な生産プラットフォームを通じて、様々な産業に大型モデルサービスを提供できるのです。 Wenxin の大規模モデルが大規模モデル実装の重要な位置をリードできたという事実は、その背後にあるもう 1 つの上昇曲線、つまり PaddlePaddle の共同最適化と切り離すことはできません。 PaddlePaddle の文学的思考の包括的な強化には 4 つのレベルがあります。 まず、PaddlePaddleは大規模モデルの開発、トレーニング、推論展開をサポートし、大規模モデルの展開効率を全面的に向上させます。大規模モデルのトレーニングと反復処理は、多くのトレーニングコストと時間を消費します。PaddlePaddleとWenxin大規模モデルの連携最適化により、最新アップグレードのWenxin大規模モデル3.5では、モデル性能が50%向上し、トレーニング速度は2倍、推論速度は30倍に向上しました。 第二に、Wenxinの大規模モデルはPaddlePaddleモデルライブラリの重要な一部となっています。PaddlePaddleプラットフォーム上での微調整、推論、そして展開を通じて、様々な業界のアプリケーションを効果的にサポートし、業界が大規模モデルを導入する際の障壁を低減します。 さらに、PaddlePaddle は、大規模なモデルサイズ、高いトレーニング難易度、高いコンピューティング電力消費など、大規模モデル開発におけるボトルネックや障害に対処するためのエンドツーエンドの産業化ツールとプラットフォームを提供し、大規模モデルの開発と適用における企業のニーズをより適切に満たします。 さらに、大規模モデルの産業応用は人材と切り離せない。PaddlePaddleは750万人の開発者を集め、多数の企業による大規模モデル生成を支援してきた。中国におけるAI分野の新たな人材を数多く育成し、大規模モデルの応用における重要な原動力となっている。 ご覧のとおり、PaddlePaddle の技術とエコシステムの蓄積は、Wenxin の大型モデルが産業に向かうための継続的な原動力となっています。 IV. 中国AIはこのDNAに基づいて根付き、発展する 会議では、王海峰氏が文心易言をオフィスワーク、会議、コーディングといった場面で応用するデモも行いました。文心易言はすでに豊富な新たな応用シナリオを開拓しており、この好成績は中国の大規模モデルの持続的な発展に対する懸念を払拭するものであると言えるでしょう。 WenxinとPaddlePaddleが形成する二重らせん構造は、実用性を重視し、産業に重点を置くという中国AIの基本原則を反映しています。この傾向は、中国の大型模型業界にも現れています。 1. 参入障壁の低さ。様々な分野における技術革新により、AI技術は誰もが利用できるようになり、モデルの開発、取得、そして応用がより便利で容易に利用できるようになりました。 2. 高効率。チップ、フレームワーク、モデル、アプリケーションのフルスタック連携により、継続的な効率向上という相乗効果が得られ、モデルの展開速度が大幅に加速されます。 3. 産業統合。AIの開発、トレーニング、展開、そして応用チェーン全体は、ますます強力なサポートを受けています。「集中的な生産とプラットフォームベースのアプリケーション」により、大規模モデルは業界やセクターの実際のニーズにさらに適応しやすくなり、産業インテリジェンスを強化します。 中国ではAIの実用化がDNAの一部となっており、大規模モデルも例外ではありません。大規模モデルに代表されるAI技術と高度な生産性は、様々な産業に根付いており、だからこそ中国でインテリジェント革命が必ず起こるのです。 |