HUOXIU

今年後半には主要モデルの展開が見られるだろう:大企業 vs. スタートアップ?

大規模モデルが最も活発な段階に入るにつれ、スタートアップ企業が春雨のように次々と誕生しています。しかし、実装段階においては、セキュリティ、安定性、そして長期的なサービス提供を確保しながら、技術の実装と適用を成功させる方法が、スタートアップ企業にとってより喫緊の課題となります。

今年は大規模モデルのリリースが急増しました。不完全な統計によると、今年上半期だけで10億を超えるパラメータを持つモデルが79個リリースされました。7月18日、Metaは新たな大きな進展として、Llama 2のオープンソース化を発表しました。Llama 2モデルシリーズには、70億、130億、700億の3つのパラメータバリエーションが含まれています。その性能はGPT-3を凌駕し、オープンソースであること、そして直接商用化できることから、このような強力で無料、そして商業的に実現可能な大規模モデルが利用可能であることを考えると、多くの中小企業の研究開発計画が頓挫する可能性が高いでしょう。

大規模AIモデル間の競争は、スタートアップ企業の予想をはるかに上回る熾烈さを見せるかもしれません。大規模モデルのいわゆる「力ずくの美学」は、実際には単なる計算能力、アルゴリズム、データ以上のものを必要とします。長期的な開発は、アプリケーションの導入、エコシステムチャネル、カスタマーサービス、運用を含む体系的かつ包括的なサポートにかかっています。これらはすべて、スタートアップ企業の能力を超えていることが多いのです。データ会社SimilarWebによると、ChatGPTのグローバルトラフィックは5月から6月にかけて9.7%減少し、米国トラフィックは10.3%減少しました。消費者(Cエンド)市場における大規模モデルの応用は頭打ちとなり、より「キラー」なアプリケーションが求められているようです。しかし、ビジネス(Bエンド)市場では、大規模モデルは驚くべき可能性を示しており、最も直接的には、以前は単純だったAIツールを置き換えるという点で大きな可能性を秘めています。例えば、大規模モデルによって強化されたインテリジェントなカスタマーサービスは、インテリジェンスを大幅に向上させます。大規模モデルは、コード生成、金融意思決定、ライフサイエンスなどの分野でも計り知れない可能性を秘めています。

企業はこれに非常に熱心ですが、大規模モデルのトレーニングコストが高いため、多くの開発者や企業は依然として特定の大規模モデルを選択しています。しかし、Baiduが主張するように、大規模モデルはITアーキテクチャに大きな変化をもたらし、従来の3層アーキテクチャから「チップ-フレームワーク-モデル-アプリケーション」の4層アーキテクチャへと移行しています。大規模モデルの選択は、かつてのオペレーティングシステムやデータベースの選択と同じくらい重要になりつつあります。

過去の経験に基づくと、メーカーは強力な技術力と継続的な改善・アップグレード能力を備えていることが求められます。また、制御可能かつコンプライアンス遵守が求められる要件を満たすには、メーカーが強力な総合力と、長期にわたって人的資源と物的資源を継続的に投入する能力も必要です。

第二に、大規模モデルベンダーは単なるチャットボットの提供にとどまりません。企業のニーズに合わせてカスタマイズし、使いやすさ、完全性、セキュリティ、安定性を確保したツールチェーンを提供する必要があります。企業ユーザーのニーズは多様であり、大規模モデルの選択は、強力な汎用機能を備えているだけでは不十分です。大規模モデルの技術スタックの完全性に重点を置く一方で、企業は自社の具体的な業務に適したベンダーを選定する必要があります。そのためには、ベンダーが業界における豊富なアプリケーション経験を有し、自社の技術を実際のビジネスシナリオに適用できることが求められます。

スタートアップにとって、業界への深い浸透と大規模モデルの実装は明らかに困難です。創業者が業界や技術分野で豊富な経験を有していたとしても、スタートアップチームの不確実性は大きく、成功は関係者の力量に左右される可能性があり、主要人物の離脱によってチームが崩壊する可能性もあります。今年初め、王慧文氏が立ち上げた「Light Years Beyond」は、大規模モデル分野で最も輝かしいスタートアッププロジェクトでしたが、王氏が健康上の理由で退社した後、「Light Years Beyond」はMeituanに買収されました。

投資コストが高いということは、キャッシュフローの途絶によりスタートアップ企業がいつでも倒産する可能性があり、その結果プロジェクトが未完了になる可能性があることを意味します。

Meta がオープンソースの大規模モデル Llama 2 をリリースした後、多くの大規模モデルのスタートアップ企業は、主流の大規模モデルと競合するどころか、立ち上がる前に消滅しました。

実際、iFlytekのような二流インターネット企業でさえ、大規模な商業化ができず、主な資金源が融資と借金であるスタートアップ企業は言うまでもなく、深刻な損失と大規模モデルへの継続的な投資能力の欠如について、外部から疑問視されている。

SuperCLUEの最新評価リストによると、スタートアップが最も追いつきやすい唯一の指標である技術レベルにおいてさえ、「ハードパワー」の面では依然として大企業が優位に立っていることが示されています。中でも、百度の最新バージョンのWenxin Yiyanは、中国語分野でGPT-3.5を上回り、海外の主流の大規模モデルに匹敵するレベルに達しています。

さらに、百度文心大型モデル、アリババクラウド通益前文、華為盤古大型モデルといった国内有数の大型モデルベンダーは、ToB事業を積極的に展開しています。IDCは最近、「AI大型モデル技術能力評価レポート 2023」を発表しました。このレポートでは、製品技術、サービスエコシステム、業界応用の3つの側面から10以上の指標を分析し、百度、アリババ、テンセント、華為、iFlytek、360、センスタイムなど、国内の主要大型モデルベンダー14社を評価しました。

その中で、百度文信の大規模モデルは総合評価で最高点を獲得しました。アルゴリズムモデル、サービス能力、エコシステム連携、業界カバレッジの面で、主要な大規模モデルはそれぞれ独自の強みを持っています。

これは、大規模モデル競争における大企業の絶対的な優位性を如実に示しています。製品技術と業界への応用において、彼らは二流、三流の競合他社をはるかに凌駕しています。例えば、トップランクの文心大規模モデルは、公式発表によると、すでに15万社が文心一文テストへの参加を申請しています。百度AIクラウドは、300社を超えるエコシステムパートナーと協力し、400以上のシナリオでテストを行い、大きな成功を収めています。また、複数の企業や組織と連携して、11の業界特化型大規模モデルをリリースしています。

ほとんどの大規模企業にとって、これは最初から不利な状況に陥るのに十分かもしれません。しかし、百度、アリババ、そしてファーウェイにとって、競争はまだ始まったばかりです。これらの巨大企業にとって、長期的な投資と業界への深い育成は単なるスローガンではなく、確実に実行に移されるものです。