|
出典: Mu Feng のテクニカル ノート
2022年11月30日にリリースされたChatGPT、そしてOpenAIが最近リリースしたGPT-4(これまでで最大かつ最強のマルチモーダル事前学習済みモデル)は、どちらも一般の人々にAIの計り知れない力を真に体験させ、強いAI時代の到来を告げました。AIをめぐるこの広範な話題の中で、私たちはある疑問を深く掘り下げずにはいられません。なぜ、これほど長い年月が経った今でも、産業革命と技術革命を主導しているのは中国ではなく、依然として米国なのでしょうか? 2021年、中国は世界の主要なAI会議で発表された論文の27.6%を占め、トップに立ち、EUと英国が19.0%、米国が16.9%でこれに続いた。AI論文の発表数でも特許出願数でも、中国は世界トップクラスである。 論理的に考えると、中国のAI研究の幅広さと深さを考えると、 ChatGPTのような画期的なAIアプリケーションは中国で生まれるべきだった。自然言語の理解と生成はAI研究における重要なピークを表しており、到達して征服するには継続的な高品質のリソース投資が必要であり、アリババDAMOアカデミー、ファーウェイ、清華大学などの機関が同様の取り組みを行っているが、 強力なChatGPTを最終的に米国のOpenAIが最初に立ち上げたのは残念である。 今日、私たちはなぜ次世代の技術革命のイニシエーターになれていないのか、そして将来の技術において追随者ではなくリーダーになるにはどうすればよいのかを客観的に分析しようと試みる。 原因分析おそらく、過去20年間の中国におけるインターネットの急速な発展により、一部の国内インターネット大手の時価総額が国際舞台でアメリカのインターネット企業に匹敵するようになったため、私たちは多くの幻想を抱いています。私たちは、技術面でもアメリカと競争できると誤解しています。しかし、本当にそうでしょうか? ニュースでよく目にするように、近年、米国政府は中国のハイテク産業の発展を抑制するため、中国のハイテク産業に対して繰り返し制裁を課してきました。例えば、国家安全保障を名目に、Huawei社への技術・設備の販売を禁じる技術封鎖措置が挙げられます。 これにより、中国のハイエンドチップ産業は甚大な打撃を受け、技術ボトルネックの危機に瀕しています。私たちは米国政府の恥知らずな行為を嘆くと同時に、基盤技術の研究やシステム構築を積極的に計画してこなかった自らの怠慢も痛恨の極みです。OpenAI 社によるChatGPTとGPT4の最近のリリースは、私たちに新たな教訓を与えました。中国と米国の技術格差はハイエンドチップにとどまらず、最先端の人工知能、強力なコンピューティングネットワークなど、多くのハイテク分野で大きな格差があることに、ますます多くの人が気づき始めています。 米国政府による中国ハイテク産業への弾圧という痛烈な一撃は、依然として米国に幻想を抱いている一部の技術者をようやく目覚めさせた。彼らは、ハイエンドチップや最先端の人工知能といったコア技術は金で買ったり、物乞いしたりして手に入れられるものではなく、自らの努力によって着実に開発していくしかないことを理解している。これはまた、米国関連技術の完全国産化を目指すという我々の決意を強めるものでもある。 ビジネスモデルを過度に重視し、基盤技術の研究を軽視している過去20年間、中国のインターネット産業は急速な発展を遂げてきました。CNNIC(中国インターネット情報センター)の報告によると、2022年12月時点で、中国のインターネットユーザー数は10億6,700万人に達しています。オンラインユーザーの継続的な増加に伴い、この豊かな土壌の中で様々なビジネスモデルが実証され、拡大してきました。モバイル決済、電子商取引物流、フードデリバリーやライドシェア、ショートビデオなどは、人々の日常生活を大きく変え、利便性とエンターテイメント性をもたらすとともに、社会全体の効率性を向上させています。しかし同時に、大手インターネット企業は、新しいビジネスモデルの開発と既存の事業構造の維持という悪循環に陥っており、ほぼすべてのエネルギーを社内競争に集中させています。その結果、基盤技術研究に投入される時間と資源は相対的に圧迫され、あるいは完全に失われています。その結果、他社による技術的制約を受ける可能性が大幅に高まり、破壊的イノベーションを生み出す可能性は著しく低下しています。 中国と米国の技術開発の軌跡を比較すると、興味深い現象が浮かび上がります。中国では、技術開発は主に事業運営を中心に展開されています。つまり、ビジネスモデルが立ち上がると、その規模の事業を支えるために必要な技術の開発に重点が移ります。技術進歩は、ビジネスモデルの革新と事業の成長によって推進されます。 しかし、米国ではその逆の傾向が見られる。技術の進歩が新たなビジネスモデルを生み出すことがしばしばあるからだ。例えば、ChatGPTを立ち上げたOpenAIは、元々は非営利の技術組織だったが、AIをよりユーザーフレンドリーにすることを最初の目標に、AI分野の第一人者を集めた。その中核的な目的は、人類に利益をもたらす「安全な汎用人工知能(AGI)の実現」である。継続的な反復とアップグレードを経て、GPTモデルは最終的にChatGPTへと発展し、これは将来のAIアプリケーションの基盤技術になると期待されている。そのため、今後、膨大な数の上位アプリケーションがChatGPT上に構築されることが予想される。ChatGPT 、あるいは汎用モデルは、AI分野のオペレーティングシステムであると言っても過言ではない。それが生み出す新たなビジネスモデルや運用形態の数は計り知れない。このボトムアップ型の破壊的イノベーションは、将来の産業構造に大きな影響を与えるだろう。 私たちは、上位アプリケーションのビジネスモデルの革新に注力しすぎて、基盤技術の研究を疎かにしてきました。ECのプロモーションやショートビデオによるエンターテイメントに追われる中で、 表面的な盛り上がりは、核となる基盤技術の不足を覆い隠してしまうため、私たちは徐々に道を見失ってしまったようです。考えてみると恐ろしいことに、インターネットや人工知能といった現在の最先端技術は、他者の技術基盤の上に成り立っているように見えます。かつて私たちが誇っていたモバイル決済やEC物流は、これらの基盤技術の上位アプリケーションに過ぎません。もし他者がこれらの基盤を崩したら、私たちは全くの無力になってしまいます。だからこそ、基盤技術は極めて重要であり、その支えがなければ、すべての上位アプリケーションは空虚なものになってしまいます。 長期主義の欠如国内市場の熾烈な競争が、個人も企業も投資の成果とリターンを渇望するようになったのかもしれません。プロジェクトがすぐに成果を上げなければ、企業は持続的な資源投資を維持するのに苦労するのが一般的で、ましてや投資対効果の明確なない基礎技術研究に取り組むことはなおさら困難です。こうした落ち着きのない雰囲気、絶え間なく押し寄せるテクノロジーの奇抜な仕掛け、そして表面的な誇大宣伝は、誰もが流行や一時的な流行を追いかけることを助長し、真に長期的な技術研究に取り組む人はほとんどいません。 ジャック・マー氏のようなビジョンとリソースを持ち、10年間にわたり毎年10億人民元を投資し、最終的にアリババクラウドを創設した企業は、どれほどあるでしょうか。 そういえば、ブロックチェーン、VR、メタバースといった技術用語を覚えていますか?登場当初は大きな注目を集め、熱狂的な投資が集まりました。 しかし、熱狂が収まった後も、製品を継続的に改良し、技術の最適化に向けた綿密な研究を行っている企業はどれくらいあるでしょうか?全くないわけではありませんが、間違いなくごくわずかです。彼らはハイテクを追い求めるのではなく、目先の利益につながるツールを追い求めています。VRであれ、メタバースであれ、ChatGPTであれ、彼らにとってそれは無関係な、単なる技術的な名称に過ぎないのです。 しかし、ChatGPTもGPT4も、これらのAIアプリケーションは、どこからともなく現れたわけではありません。GPT 、GPT2、GPT3をベースに段階的な反復開発を経て開発されたものであり、トップクラスのAI専門家による長期的な取り組みと多額の資金投資の集大成です。OpenAIは、Microsoftからの投資を受けて第一世代のGPTモデルに基づくプロトタイプを作成するまでの3~4年で1億ドル近くを費やしましたが、これはChatGPTが現在達成している成功レベルには程遠いものでした。 基礎技術研究は一夜にして達成できるものではなく、継続的な試行錯誤、将来の技術動向に対する独自のビジョン、そして何よりも長期的なコミットメントが必要です。 しかし、AlibabaとHuaweiが年間1,000億人民元以上を技術研究に投資しているという事実は、私たちを勇気づけるものであり、近い将来、新たな技術革新が生まれると信じています。 技術システムサポートの欠如チップの設計、製造、パッケージングテストなどの複雑な一連のプロセスを伴うハイエンドチップ製造と同様に、 汎用の大規模モデルも複雑なシステムエンジニアリングプロジェクトです。 このようなモデルのトレーニングには、大量の高品質のトレーニングデータ、優れたディープラーニングアルゴリズム、 強力なコンピューティングリソースが必要です。 ChatGPTの成功は、高品質のラベル付きデータによるものです。OpenAIはデータのラベル付けのために40社以上の請負業者を雇用しましたが、これは中国ではほとんど想像もできないことです。さらに、 2023年1月のChatGPTの平均ユニークビジター数が1,300万人であることを考えると、これは3万個を超えるNVIDIA A100 GPUのチップ要件に相当します。 膨大な計算能力がなければ、高品質の汎用大規模モデルをトレーニングすることは困難でしょう。 つまり、汎用大規模モデルの学習には、それを支える包括的な人工知能技術システムが必要です。そうでなければ、たとえ高度なアルゴリズムを用いても、 高品質な学習データをどのように入手するか、膨大な学習用計算リソースをどこで見つけるかといった問題が、汎用大規模モデルの学習において解決すべき課題となります。 高品質なデータと計算能力のサポートがなければ、熟練した料理人が米なしで料理を作ろうとするようなものです。 行き詰まりを打破する方法汎用大規模モデルは、人工知能の将来の発展にとって重要な方向性を示しています。最先端のAI技術をめぐる競争で優位に立つためには、リソース投資を確実に増やす必要があります。では、この行き詰まりを打破するにはどうすればよいでしょうか?まずは、以下の点から始めることができると考えています。 データ 現在、オンラインの中国データは膨大である一方、その質は概して低く、データサイロ化が大きな問題となっています。中国データに基づいて汎用的な大規模モデルを学習させるには、オンラインの中国データの質を向上させ、データサイロ化に対処し、データの共有と相互運用性を促進する必要があります。
コンピューティングパワーの構築に関しては 国家東西コンピューティングプロジェクトと各地域のコンピューティングセンターの連携を組み合わせることで、全国規模のユニバーサルコンピューティングインフラストラクチャを構築し、国家統合型新コンピューティングネットワークシステムの構築を加速させ、汎用大規模モデルのトレーニングに持続的かつ強力なコンピューティングサポートを提供します。これにより、大規模モデルのトレーニングに必要なコンピューティングパワー要件を満たすと同時に、強力な人工知能時代の到来に備えたコンピューティングリソースを整備することが可能になります。 意識 もちろん、他国との技術格差を埋めるために全力を尽くさなければなりません。しかし、私たちが進歩している間、他国も進歩していることを認識する必要があります。したがって、単に追いつくだけでは不十分です。より長期的なビジョンを持ち、未来を的確に判断し、早期の技術検証と産業計画を実施し、次の技術革命に備え、追随者ではなく、真の意味で未来の技術開発のリーダーとなる必要があります。 要約技術の進歩は一夜にして達成されるものではなく、何世代にもわたる技術者たちのたゆまぬ努力の積み重ねによって実現されます。多くの分野で大きな進歩を遂げてきた一方で、コンピュータサイエンス、インターネット技術、人工知能といった分野では、依然として大きな課題が残されていることを認識しなければなりません。だからこそ、ネット上の有名人やスターへの露出を減らし、科学技術分野の人々がより熱心に、そして実践的に技術を広め、技術を重視する社会環境を醸成することが、テクノロジー産業の未来の繁栄の礎となるのです。私たちが衝動的にならず、より集中して取り組めば、次の技術革命は中国から生まれるかもしれません。最後に、将来の技術発展について考える上で非常に参考になると思われる、馬教授の言葉をご紹介します。 「ギャップを埋める」という言葉には、常々問題があると感じてきました。西洋のものが必ずしも先進的だから、私たちがそれを埋めるべきだということではありません。今日、私たちは何かに同調したり、特定の国の基準に適応したり、ギャップを埋めようとしたりすべきではありません。むしろ、未来にどのように適応し、未来の基準にどのように適応し、そして未来のギャップをどのように埋めていくかを考えるべきです。他者が何をしているかを見る前に、未来が何をもたらすのか、そしてどのようなシステムを構築したいのかを理解する必要があります。他者の言葉を繰り返し、他者が設定した話題ばかりを議論していると、現在を見失うだけでなく、未来を見失ってしまうでしょう。 |