HUOXIU

今日の中国における AI の問題は、大規模で整理されていないモデルが多すぎることです。

OpenAIの開発者デーイベントの後、GPTモデルはAIへの新たな熱狂の波を巻き起こし、開発者が圧倒的な勢いで利用したため、OpenAIのサーバーが一時的にクラッシュする事態にまで至りました。その後、GPTの様々な独創的な活用方法が生まれ、この新しいモデルをめぐる大きな論争も巻き起こりました。中国のIT専門家、ソフトウェア開発者、AIエンジニアも積極的に議論に参加し、新たなAIブームを巻き起こしました。

しかし、こうした雰囲気の中で、ある沈黙が際立っている。それは、大手AI企業の大多数が沈黙しているということだ。中国のAIコミュニティは、わずか1年でGPTを模倣した数百もの大規模AIモデルを生み出してきた。しかし、スターアプリケーションを生み出したり、製品イノベーションを推進したり、大規模なユーザーベースを獲得したりすることができたのは、ごくわずかだ。OpenAIのフライホイール効果が顕著になるにつれ、これらの大手AI企業は、模倣すればするほど差が開くと感じている。そのため、彼らは新しいトレンドを追いかけるのをやめ、今できることをやり遂げることに集中している。

今年の初め、ソーシャル ネットワークやメディアでは中国が大規模なモデルを開発できるかどうかが議論されていたことを思い出します。

当時、これは実際には誤った主張だと私たちは言いました。なぜなら、中国にはすでに大規模モデルが存在していたからです。そしてChatGPTがヒットした後、中国のAIが直面している問題は、大規模モデルの不足ではなく、むしろ過剰であることは明らかです。

今日、この問題が顕在化し始めています。中国のAI業界が現在直面している最大の問題は、大規模なモデルが多すぎて、それらが非常に無秩序になっていることです。

巨大な模型には人がいっぱいでした。

中国は実際に、大規模AIモデルをいくつ保有しているのだろうか?爆発的な成長を遂げたこの1年を経て、この数字はもはや混乱を極めている。今年前半は数十程度とされていたが、11月には100以上、あるいは200以上という声も上がった。つまり、中国は現時点で間違いなく世界で最も大規模AIモデルを保有する国であり、米国をはるかに凌駕しているのだ。

しかし、これら100を超える大規模モデルは実際に利用されたことがあるでしょうか?比較や評価されたことがあるでしょうか?おそらくないだろう。なぜなら、大規模なユーザーベースを獲得した少数の主要モデルを除けば、それらのほとんどはオープンソースコミュニティに存在し、プレスリリースでしか紹介されていないものもあるからだ。

これは一体何に似ているのでしょうか?関連データによると、中国のサッカー人口は2600万人で世界一だということを、多くの人が知らないようです。このデータの出所は確認できませんが、私たちの周りではサッカーをする人はそれほど多くないように見えます。それでも、代表チームの活躍は紛れもないものです。

なぜこんなに大きなモデルがたくさんあるのでしょうか?

まず、今年は大規模AIスタートアップセクターが好調で、稀有な投資機会が生まれています。テック業界のVC市場は低迷しており、他のインターネットベンチャーキャピタルプロジェクトは概ね失敗に終わり、暗号通貨も厳しく規制されていますが、今年は大規模AIスタートアップが注目を集めています。そのため、ホットマネーが限られているにもかかわらず、大規模AIスタートアップには依然として資金が集まっています。

第二に、一般的に考えられているのとは異なり、大規模モデルスタートアップの参入障壁はそれほど高くありません。株式やストックオプションなどの手段で優秀な人材を確保できれば、大規模モデルスタートアップは過大な費用負担を強いられることはありません。製品開発、ユーザープロモーション、ハードウェア開発といった資金のかかる選択肢を持つ他のテクノロジー分野と比較すると、大規模モデルスタートアップは豊富なオープンデータセットと無料ツールを保有しているため、大規模モデルの学習のみに高いコスト障壁を抱えることはありません。さらに、複雑なビジネスシステムの構築が必要なインターネットスタートアップとは異なり、大規模モデルプロジェクトは多くの場合、研究チームのみで十分です。

さらに、「パフォーマンス向上」を目的とした大規模モデルも存在します。これは、大規模モデルの数を大幅に増加させるものです。これは通常、大規模モデル関連のプロジェクトに資金を獲得しやすい大学や研究機関のチームによって行われ、プロジェクトの成果が公開されると、大規模モデルの数は再び増加します。あるいは、大企業が上司に大規模モデルの作成を要求し、IT部門がオープンソースのモデルフレームワークをベースに構築する場合もあります。たとえ成果が芳しくなく、実装が困難であっても、社内外で積極的に推進されます。

良好な線路状況、低コスト、タスク完了の必要性が、中国における大型モデルの増加の原動力となっており、生産効率も向上しています。

問題は、サッカー人口の規模は確かに重要かもしれないが、ワールドカップに出場できるチームを持つことの方がさらに重要だということだ。

希望のない狭い道

すると、モデルの数が多いことは有利ではないのか? 量が多いだけで奇跡を起こせるのではないか? もしかしたら、モデルの数が多いほど、最適なモデルを選別できるのではないか? という疑問が湧くかもしれません。

これはおそらく非現実的です。様々な理由から、今日のモデルの巨大な規模は持続不可能です。GPTのようなモデルを作成して次の技術時代に飛び込むという壮大なアイデアは、大規模なAIモデルを絶望的で狭い道に変えてしまいました。

次の質問に立ち向かってみましょう。

1. 大規模モデルを多数持つことは、大規模モデルの本質に反します。

大規模モデルについて語る際、その利点として、一般化能力と高い堅牢性を挙げます。これらはひいては「知能の創発」効果につながります。私たちはOpenAIのGPTシリーズが一貫してモデルの一般化能力を深く探求してきたことに、常に驚嘆しています。言い換えれば、大規模モデルの利点は、1つのモデルで複数のモデル群全体を置き換えることができることです。しかし、これは大規模モデルの過剰生産を招き、大規模モデルの本来の目的に反し、膨大な社会資源を浪費しています。

2. 大規模モデルは基盤となる技術であり、その基盤となる技術を使用するプレーヤーは多くありません。

AI開発を例に挙げると、モデルそのものの先にはAIチップとAIフレームワークがあります。ここ数年、多くの企業がこれらの分野に参入しましたが、そのほとんどは最終的に失敗に終わりました。AIチップは出荷できず、AIフレームワークは売れず、大手企業は1、2社しか残っていません。大規模モデルにも同じことが当てはまり、この分野は統合へと向かう運命にあり、既存のプレーヤーは少数にとどまることになります。

  1. 大規模モデルは開発プロセスから遠く離れています。

大規模スタートアップモデルの多くは、開発者誘致のためにオープンソースモデルを選択しています。しかし、実際には、これらのモデルは海外の大規模オープンソースモデルや国内の有力モデルと比較して実質的な競争力に欠けており、大規模な開発者集積効果を生み出すことができません。これらの大規模モデルは、オープンソースとして公開された際には積極的なプロモーションで注目を集めますが、開発者は実際に体験するとすぐに興味を失ってしまいます。

4. ユーザーから遠く離れた大きなモデル。

予測されるシナリオでは、大規模モデルの大半は商用サポートを欠いており、これがこの分野における最大の問題となっています。大規模モデルのスタートアップにとって、最も困難な状況はまさに創業当初から存在します。後に多くの批判を浴びることになるマシンビジョン企業は、初期段階ではスマートセキュリティ市場からの支持を得ていました。しかし、大規模モデル企業はアルゴリズムしか持っておらず、実現可能な商用化の道筋すら見出せていません。

これらの問題は、すでに収益性の高い大規模モデル研究の衰退につながっています。現状では、アルゴリズムは革新的であるもののパラメータが膨大であり、実際にはほとんど利用されておらず、商用アプリケーションは完全に無視されています。

モデルが増えると、混乱も増えます。

大規模モデルが数多く登場し、業界はますます活性化していますが、避けられない問題もいくつかあります。大規模モデルが多すぎるだけでなく、やや混沌とした状態にあるというのは、まさにこのことです。

現在、「大型模型を使うかどうかは重要ではなく、ただ持っていればいい」という考え方が大きく浸透しています。このため、大型模型の開発コストを削減したり、レトリックを用いてその価値を誇張したり、さらには大型模型を取り巻く誇大宣伝を利用して、実際には大型模型技術ではないプロジェクトをパッケージ化したりするなど、様々な手法が生まれています。その結果、大型模型コミュニティは、標準以下の、あるいは不適切な実践例も見られる、玉石混交の状態になっています。

1. 大規模なランキングおよびスコア操作モデル。これらのモデルの数が非常に多く、実装アプローチもほぼ同様であるため、企業間の差別化はほぼ不可能です。差別化と先進性を強調するために、独自の専門用語を作り出し、その技術を用いたテストで特定のスコアを達成した、あるいは特定のリーダーボードで記録を更新したといった宣伝を行うのが一般的です。

実際、ほとんどのリーダーボードはモデルの単一の次元のみをテストするため、ターゲットを絞ったパラメータ調整が可能です。ランキング操作は難しくなく、操作の余地はかなりあります。同様に、コミュニティ開発者が付与した星の数や、カンファレンスで発表されたトップ論文の数なども、一般的なパッケージング手法です。

2. プロジェクト完了重視の大規模モデル。多くの大規模モデルは、プロジェクト完了や企業のデジタルトランスフォーメーション・プロジェクトの完了に利用されます。これらのモデルの寿命は、レビューが完了し、プロジェクトが成功裡に終了し、モデルがオープンソース化された時点で終了します。これらの大規模モデルは、アプリケーションシナリオやその後の更新を考慮していないため、やや短命で一時的な性質を持っています。

3. オープンソースの大規模モデルへの過度な偏重。オープンソースソフトウェアは間違いなく成長トレンドですが、近年の中国におけるオープンソースイニシアチブの急速な発展は、AIモデルのオープンソース化というトレンドを牽引し、流行の兆しを見せています。さらに、一部の企業は、大規模モデルのオープンソース化と無料配布をトラフィック獲得の手段として好んで利用しています。オープンソースは徐々に、低品質でメンテナンスが不十分な大規模モデルの隠れ蓑となってきました。

4. 大規模モデルの模倣。大規模モデルが普及すると、一部の企業がこのトレンドに乗じようと試み始めました。その結果、非標準的な事前学習済み大規模モデル技術を用いて大規模モデルを模倣したり、古いチャットボットやアプリケーションを大規模モデルとして単純に再パッケージ化したりするケースが蔓延しました。大規模モデルを利用して他の古いアイデアを封じ込めることもビジネス化されました。

5. 大規模モデルの再パッケージ化と変換。最近、一部のスタートアップ企業が海外のオープンソースモデルを再パッケージ化したとして非難され、論争を巻き起こしています。実際、同様の慣行は業界では珍しくなく、多くの大規模オープンソースモデルが書き換えられ、再パッケージ化されて自社開発モデルへと生まれ変わっています。

こうした大規模モデルチームは、疑わしい人物ばかりで、自らの革新力と差別化をアピールするために、新たな用語を作り出したり、修飾語を強化したりすることにも頼ります。最終的には、真の技​​術革新が一連の「偽装されたイノベーション」に埋もれてしまうのです。

中国のAI春:大規模モデルの90%を削除した後

米国の大規模モデル産業構造を見ると、各階層のモデル数の差が比較的小さいピラミッド構造をとっていることがわかります。つまり、OpenAIが優勢であり、Google、Microsoft、Meta、Xが継続的な競争力を維持している一方で、開発者コミュニティが比較的活発な、その他20以上の広く利用されている大規模モデルが存在しています。

もちろん、アメリカを真似しなければいけないと言っているわけではありませんが、技術大国の現状を見ると、大型模型産業の規模がどの程度なのかが大体わかります。

中国の大規模モデルは、短期間のうちに本来の能力をはるかに超える発展を遂げました。こうした大規模モデルの過剰な数は、一方では膨大な研究開発費、計算能力、そしてデータ資源を浪費する一方で、長くは続かない「危機」を孕んでいます。

資本バブルが冷え込んだ後、私たちは次のような事態を目の当たりにしました。多くの大型モデルが突然更新停止し、それに続いて大型モデル関連企業が次々と倒産しました。資本の撤退と従業員の報酬の低下により、問題が顕在化し始め、メディアは大型モデルの「冬」を予測し、ソーシャルメディアではAI技術が嘲笑されました。

この業界の急激な冷え込みは、真に競争力と革新性を備えた中国の AI 企業にとって大きな問題を引き起こす可能性が高いでしょう。

しかし、これは AI が失敗しているという意味ではなく、これらの AI 企業と大規模モデル プロジェクトが決して標準に達していなかったという意味であることを覚えておいてください。

これはAIの冬ではなく、中国におけるAIの真の春の始まりです。産業の最適化と再構築から生まれる大規模な産業モデルこそが、応用イノベーション、製品の改良、そしてインテリジェントな産業実践の実践における中国の優位性を真に活かすことができるのです。

中国において、比較的健全な大規模モデル産業は、互いに競合できる主流の大規模モデルを5つ程度、根本的な技術革新と国際競争力を維持できる大規模モデルシステムを1~2つ、そしてオープンソースの大規模モデル群と、AIを科学技術に活用する学術分野の大規模モデルをある程度備えた構成でなければならない。さらに、AIチップ、AIコンピューティング、ディープラーニング開発フレームワーク、AI開発ツールなど、大規模モデルを支えるインフラが比較的整い、これらの分野で高い自給自足を実現している必要がある。つまり、現在の大規模モデルの90%以上を段階的に廃止する必要がある。

これらのハードウェアとソフトウェアの基盤を基盤として、多くのスタートアップ企業やAI開発者が、コンシューマー(Cエンド)とビジネス(Bエンド)の両分野において、大規模モデルの実用化を模索するはずです。これらの大規模モデルが特定の産業と融合する垂直分野では、これらのモデルを普及・複製するための産業エコシステムが形成されます。オフィスワーク、エンターテインメント、情報アクセスと融合した大規模モデルなど、主要なコンシューマー(Cエンド)市場には、数千もの企業が参入し、インターネット経済に続くAI経済の奇跡が生まれるでしょう。

それまでの「百モデルの戦い」を生き残ったのは、核となる技術革新を持つ企業、プラットフォーム型産業チェーンを形成する企業、そしてすぐに商業的な販路を見つけてプラスの資本循環を形成できる企業の3つのタイプだけだった。

私たちは、AI テクノロジーによって、いつの日か TikTok、WeChat、Office の新しいバージョン、さらにはこれまで想像もできなかったようなものが生まれると確信しています。

しかし、今日の大規模モデルのほとんどは、結局は歴史の隙間やオープンソース プラットフォーム上に埋もれ、偉大な時代の単なる脚注となってしまうでしょう。