|
今日、AIは技術開発サイクルの中心軸となり、世界的な注目を集めています。これまでの技術革命やAIの波とは異なり、今回、中国は世界をリードするAI国家の一つとなっています。 学術的なインスピレーションから世界をリードする特許技術まで、一流の会議論文から壮大なAI産業のレイアウトまで、中国のAIの量的および質的な変化は、一歩一歩土壌に根を下ろした無数の人々の努力と進歩を体現しています。 5月6日、第12回呉文軍人工知能科学技術賞授賞式が正式に開催されました。その中で、百度(バイドゥ)最高技術責任者、国家深層学習技術応用工学研究センター所長の王海鋒氏が完成させた「知識と深層学習を融合した総合対話技術と応用」の成果が「2022年呉文軍人工知能科学技術進歩賞特別賞」を受賞しました。これは「呉文軍賞」が授与する初の特別賞でもあります。 この特別な瞬間は、中国最高の AI 賞の受賞者、中国の AI 科学者、そして中国の AI テクノロジー企業にとって 12 年の歴史を記念するものです。 中国における AI がどのように一歩一歩進歩しているのか興味がある人にとって、この賞は個人や企業がどのように山を征服するかを知る絶好の機会です。 1000フィートの山に登る勇気:百度の登山道は「呉文軍賞」を伴っている ここ二日間、皆さんは「呉文軍賞」に関するニュースをたくさん目にしたはずです。 2011年、中国人工知能協会が「呉文軍人工知能科学技術賞」を創設した日を振り返ってみましょう。当時、中国のAI産業がこれほど大きな成功を収めるとは、ほとんどの人が想像していなかったでしょう。 呉文軍賞、百度、そして王海鋒にとって、この12年間は注目すべき旅路であった。 12年前に新設された呉文軍賞は規模が小さく、初回の授与数はわずか5件でした。受賞者のほとんどは、北京郵電大学や中国科学院自動化研究所といった大学や研究機関からでした。過去12年間で、この賞は200以上の組織や業界団体、そして700人以上の専門家や学者に授与され、中国のAIにおける学術界と産業の力の高まりを物語っています。 百度は、中国の AI 業界におけるこの量的変化のプロセス全体にわたって存在してきました。 2010年当時、AIに対する人々の想像がまだSF映画のように、はるか遠く、理解しがたいものだった頃、百度は既にAI技術の蓄積を始めていました。2010年、王海鋒氏が百度に入社し、自然言語処理(NLP)、ナレッジグラフ、ディープラーニングといったAI技術を新たな応用分野へと押し上げました。 百度の技術は新たな段階に入り、AI関連の取り組みが相次いで開始されています。例えば、2010年に設立された百度自然言語処理(NLP)部門は、百度で最も古い基盤技術部門の一つです。また、2013年には百度深層学習研究所(IDL)が設立され、中国産業界において最も早く深層学習技術に取り組んだ機関の一つとなりました。その後も、百度はビッグデータラボ(BDL)、シリコンバレーAIラボ(SVAIL)、百度研究所といった研究機関を次々と設立しています。 百度が人工知能分野において包括的なリーダーシップを獲得し、遠くにある未知の景色をいち早く見ることができたのは、まさにAIへの早期かつ深い関与があったからこそです。 AIの産学研融合を推進する第一人者である王海鋒氏が、「呉文軍賞」の12年の歴史の中で「呉文軍人工知能分野における卓越した貢献賞」を受賞した。 王海鋒氏のチームは、「知識と深層学習を統合した汎用対話技術と応用」プロジェクトで、呉文軍人工知能科学技術進歩賞の特別賞を受賞した。 ここから、「呉文軍賞」が実際に何を表彰するものなのかも分かります。 中国の人工知能分野で最高の栄誉である呉文軍賞が従来の慣習を打ち破ることができたのは、百度AIが常に未知の技術分野に進出し、未発見の領域を積極的に模索しているからだ。 今回「特別賞」を受賞した「知識と深層学習を統合した汎用対話技術とアプリケーション」プロジェクトを例にとると、この研究プロジェクトでは、この分野における以下の4つの技術的課題を解決しました。 ばらばらの対話の問題を解決するために、統一された知識表現に基づく一般的な対話管理技術が提案されています。不明瞭な対話の問題を解決するために、知識統合型ストリーミング対話音声認識技術が提案されています。不正確な理解の問題を解決するために、知識強化型一般的な対話理解技術が提案されています。誤った応答の問題を解決するために、潜在的な変数と知識に基づく対話生成技術が提案されています。 受賞スピーチで、王海鋒氏は次のように述べました。「汎用対話技術は、人工知能分野において最も挑戦的な分野の一つであり、汎用人工知能の必須機能とも考えられています。長年にわたり、私たちのチームは技術の探求と革新を続け、知識と深層学習を統合した汎用対話技術のブレークスルーを実現しました。この技術は現在、様々な産業や人々の生産活動、日常生活に広く活用されています。」 1000フィートの山を登る勇気を持った百度は、最終的に「呉文軍賞」とともに、中国のAIの進歩と世界のトップとの出会いを目の当たりにした。 AIへの道の深化:基盤技術の強化と独自の視点の育成 呉文軍人工知能科学技術進歩賞(特別賞)について、学者や専門家は次のようにコメントした。「全体的な技術指標と応用効果は国際的にトップレベルに達しており、この分野における我が国の科学技術競争力と産業影響力が大幅に向上した。」 学術的な厳密さと産業の幅広さが、Baidu の受賞歴のある研究プロジェクトの 2 つの大きな特徴であることは容易にわかります。 百度の汎用対話技術は、82件の発明特許を取得し、36件のハイレベル論文を発表し、権威ある国際評価で11の世界賞を受賞しているとのことです。同時に、大規模な産業応用も実現し、小度などのサービスをベースに5億台のスマートデバイスの対話機能をサポートし、10億人以上のユーザーにサービスを提供しています。通信、金融、自動車、エネルギーなど20以上の業界をカバーしています。 今日、百度が蓄積してきた汎用対話技術の専門知識とブレークスルーは、その技術ブループリントを通して全く新しい分野へと流れ込んでいます。例えば、世界的に高く評価されているAIの新興企業、大規模言語モデルなどがその例です。 文心易言は、大手テクノロジー企業が独自に開発した世界初の大規模言語モデルであると多くの人が考えています。この登場により、中国は急速に世界最先端言語モデリング(LLM)の地位を獲得し、中国のAIにさらなる戦略的空間を確保しました。文心易言を支えるのは、成熟した汎用対話技術です。 対話強化は文心易言の中核技術の一つであり、文脈理解と多ターン対話能力を強化し、対話の完全性、一貫性、合理性を高めます。対話強化は百度が汎用対話技術の優位性を基にさらに革新したものです。百度は潜在空間に基づくグローバル生成オープンドメイン対話モデルである文心PLATOを提案し、モデルのコンテンツの豊かさと一貫性を継続的に向上させています。文心PLATOは百度が開発した多数のパラメータを持つ中国語と英語の対話用の事前学習済み生成モデルです。複数回のアップグレードを経て、現在では数百億のパラメータを持つバージョンに到達しています。こうした汎用対話技術の長期にわたる蓄積こそが、文心易言に対話強化という重要な優位性をもたらしているのです。 Wenxin Yiyan には、対話強化に加えて、知識強化および検索強化のテクノロジーも搭載されています。 知識強化の面では、百度が構築した5,500億の事実の知識グラフと、2019年3月に早くも提案されたERNIEセマンティック理解フレームワークのおかげで、百度はセマンティック理解テクノロジー能力を継続的に強化してきました。 Wenxin Yiyanは、膨大なデータからの学習と大規模な知識を統合し、知識強化に大規模なナレッジグラフを活用します。また、ナレッジグラフを直接呼び出して知識推論を実行し、プロンプトを自動構築することで、ユーザーのニーズに効率的に対応できます。 検索機能の強化もまた、百度が持つ既存のセマンティック理解技術の優位性に基づくイノベーションです。百度は世界最大の中国語検索エンジンを保有しており、百度検索はセマンティック理解とマッチングを基盤とした新世代の検索アーキテクチャへと進化しました。ユーザーのニーズとウェブページの内容を深く理解し、セマンティックマッチングを実行することで、より正確な検索結果を得ることができます。これにより、大規模なモデルに対して高精度かつタイムリーな参照情報を提供し、ユーザーのニーズにより適切に対応できるようになります。 さらに注目すべきは、文心易燕が今も急速に成長を続けていることだ。 インタビューの中で、王海鋒氏は社内テストの段階で、一部の社員がなぜ文鑫易言が頭字語詩をうまく書けないのかと疑問に思っていたことを明かした。当時、文鑫易言はまだ学習段階だった。王海鋒氏は非常に自信に満ち、「1、2日で学習できるようになるはずだ」と答えた。案の定、翌日には文鑫易言は頭字語詩を書けるようになった。王海鋒氏は「システムの能力を比較的正確に把握できているからこそ、自信が持てるのです」と語った。 最近、PaddlePaddleはWenxin Yiyan向けに特別な最適化を実施し、1ヶ月で4回の反復処理を実施して推論性能を10倍向上させました。中でも、業界初の動的挿入をサポートする分散推論エンジンは、推論性能を123%向上させました。 文心易言のあらゆる側面は、百度の技術戦略である基盤技術の強化と技術優位性の体系的な蓄積を如実に示していると言えるでしょう。王海鋒氏の技術ビジョンと技術へのこだわりが、この戦略において重要な役割を果たしたことは明らかです。 技術の進歩は非常に長いプロセスです。技術のモメンタムを継続的に補充しなければ、「疲労」によって頂点に到達することは不可能になる可能性があります。文心大型モデルERNIEと対話型大型モデルPLATOをベースとする文心一眼は、百度のAI技術の持続的な力によって、より遠く、より速く進むことができます。 緑の丘も視界を遮らない:Baidu AI が産業界に進出。 「大規模モデルのトレーニング」から「大規模モデルの利用」への移行は、この大規模言語モデルの波に対して、中国の産業界、学界、政府を含むさまざまな分野で根深い期待となっている。 AIと産業の間の未知の領域をどのように進み、あらゆる分野に到達し、社会とより深く融合していくかは、今日のテクノロジー企業が直面している新たな課題です。 文鑫易眼のコア技術は、百度が10年以上かけて蓄積してきたチップ、フレームワーク、モデル、アプリケーションという4層アーキテクチャに基づいています。この包括的な技術システムが、文鑫易眼の業界への進出を支えています。 チップレベルでは、百度は自社製の量産AIチップ「崑崙(クンルン)」を保有しています。同時に、百度はハードウェア業界の上流および下流のプレーヤーと緊密なパートナーシップを構築し、国内外の主要チップメーカーとの優れた互換性を実現しています。そのため、百度はあらゆるメーカーの適切なAIコンピューティングパワーを活用することができ、AI事業の今後の発展に必要なコンピューティングリソースを確保しています。 フレームワーク層では、Baidu が独自に開発したオープンソースの業界レベルのディープラーニング プラットフォームである PaddlePaddle が、大規模モデルの柔軟な開発、効率的なトレーニング、推論の展開をサポートします。 モデルレベルでは、大規模モデルERNIEや大規模対話モデルPLATOなど、文鑫が自社開発したモデルは、文鑫易言の中核技術がすべて中国企業の手に渡っていることを証明している。 アプリケーション層では、Baidu は 200 を超える AI 機能とアプリケーションを開発・公開しており、PaddlePaddle プラットフォーム上で多数のアプリケーション モデル、開発者ツール、カスタマイズされたサービスを提供し、さまざまな業界で AI をより簡単に利用できるようにしています。 これら 4 つの層は、百度の AI 戦略の包括性と長期的なビジョンを示すものであり、文心易言の継続的な上昇を保証するものでもあります。 王海鋒氏の言葉によれば、百度独自の技術と蓄積により、一般ユーザーは異なる体験を得ることができる。第一に、テキストが文脈を記憶し、更新された情報とより正確な知識を提供できるため、効果はより高くなる。第二に、モデルの推論効率が向上し、ユーザーの待ち時間が短くなるため、効率はより高くなる。 このことから、業界における Baidu AI の明確な差別化特性がわかります。 1. 向上心を持ち、コア技術のブレークスルーを維持し、未知の技術フロンティアを果敢に開拓し、世界規模で基盤技術のブレークスルーを積極的に推進し、中国のAIを世界の最先端技術と同等か、リードし続ける。 2. 草の根レベルでAIインフラを強化し、業界の自立と統制を確保する。大規模モデルの学習と推論には、チップ、フレームワーク、開発ツールなど、様々なハードウェアとソフトウェアのコンポーネントが必要となる。コアインフラが国内で管理されていない場合、業界による利用に懸念が生じる。百度は4層AIアーキテクチャにおいてコア技術の包括的な自主開発を実現し、AIの産業化と産業界へのAI導入に関する懸念を払拭した。 3. 今後、私たちは産業エコシステムの構築を主導し、大規模モデルと実際の産業とのギャップを埋めていきます。オープンソースのPaddlePaddleエコシステムとPaddlePaddle産業エンパワーメントセンターを通じて、AI技術を強固にし、オープン化することで、様々な産業での活用を可能にし、より多くの人々がAIの頂点に登り、未来の展望を見据えられるよう支援します。 今、百度AIを振り返ると、そのリーダーシップは結果ではなく、数々の技術革新が積み重ねてきたプロセスであることが分かります。こうした過去の成果が凝縮されて、私たちが知る百度AIと、新たに登場した文心易言(ウェンシン・イーヤン)が誕生したのです。 呉文軍賞を受賞したことで、既に頂点に立つ百度は、今、さらなる高みへと登りつめている。大規模モデルによって切り開かれたAIと産業の融合の道は、まるで未知の領域のように、計り知れない潜在的価値に満ちていると同時に、不確実性も孕んでいる。勇気ある人々が、その先陣を切り、その秘密を探る必要があるのだ。 瞬く間に12年が過ぎた。テクノロジーの最先端を行く百度は、新たな地平を切り開く新たな旅へと踏み出した。そびえ立つ山々も子供の目を遮ることはできない。鳥の鳴き声や鳩の群れも、旅人の足音を遮ることはできない。 |