HUOXIU

神はサイコロを振らない?センスタイムのAIメガデバイスが試してみた

蒼飛寺の李玄発
QuantumBitレポート | WeChat公式アカウント QbitAI

衝突型加速器は、新しい物理的粒子を発見するための方法および装置です。

よく知られている高エネルギー物理学のインフラストラクチャは、基礎物理学の分野における研究の集大成です。

センスタイムも今、長年にわたる産学連携研究の成果として、最新の技術成果と包括的なAIインフラを結集したAIプラットフォームを開発しました。

その名はSenseCore AI Large Device

センスタイムの徐立CEOは、これはセンスタイムの長期的な中核競争力の表れであり、同社の継続的な運営とより大きな飛躍のための堀であり、AI時代の生産要素の削減を推進する重要な一歩であると述べた。

実際のところ、徐立氏は起業家としての側面から、この問題については非常に控えめであるように見えますが、科学者としての側面が現れると、非常に興奮し、早口で話します。

人間の脳は宇宙の膨張速度に追いつけないかもしれない。宇宙の真実を真に解き明かしたいのであれば、入力の根拠を、この人物、この場所、限られた人間の認知力だけに頼ることはできない。現在のプロセスの説明を追求する必要すらない。より大規模なデータとより強力な計算能力を用いることで、より予想外の結果につながる可能性がある。

したがって、SenseTimeの大規模AIデバイスは、GPT-3とAlphaFoldのパスをより大規模に実装したものと理解できます。これは、ビッグデータ、大規模モデル、そしてスーパーコンピューティングパワーの三位一体の実践であり、入力から出力までの「ほぼ正しい方向」に沿った多大な努力によって達成された奇跡です

SenseTimeの大型AIデバイスはどのように構成されているのでしょうか?

上海臨港新区では、チップを模した建築群が今年末までに稼働を開始する予定だ。

これはSenseTimeの最新AIコンピューティングセンター(AIDC)で、ピーク時の演算速度は3740ペタフロップス(1ペタフロップスは1秒あたり1京回の浮動小数点演算に相当)です。参考までに、数千億のパラメータを持つOpenAIのGPT-3モデルでは、完全なトレーニングセッションを完了するのに3.14E23回の浮動小数点演算が必要ですが、SenseTimeのLingang AIDCではわずか1日でトレーニングを完了できます。

間違いなく、SenseTime の新しい AIDC は、より大規模なパラメトリック モデルのトレーニング用に設計されています。

しかし、SenseTimeの大型AIデバイスでは、AIDCが1/3以下、1/3以下を占めています。

SenseTime の AI メガデバイス SenseCore 全体は、次の 3 つの層で構成されています。

  • コンピューティングパワーレイヤー(AIチップと処理カード + AIDC + AIセンサー)

  • プラットフォーム層(モデル生成 + トレーニングプラットフォーム + データプラットフォーム)

  • アルゴリズム層(アルゴリズムツールキット + オープンソースフレームワーク)

3 in 1 のアプローチでは、モデルをインフラストラクチャとして出力し、AI 機能をエンタープライズ サービス、都市管理、個人生活という 3 つの主要なアプリケーション領域に拡張します。

小規模なワークショップ形式の「AI モデル」の作成とは異なり、大規模な AI デバイスは、さまざまなシナリオの基礎となるアルゴリズム モデルを抽象化し、モジュール式のプラットフォーム スイートを使用して汎用的なサービス プラットフォームを作成できる、組立ライン工場のようなものです。

特に、AI 実装におけるロングテールの顧客やシナリオの場合、さまざまなアルゴリズム キットを組み合わせることで新しいシナリオをカスタマイズし、低い限界費用で新しいシナリオの大規模なカバレッジを実現できます。

さらに、SenseTimeのAIプラットフォームインフラストラクチャのシステムシナジーに基づいて、半自動かつ適応的な方法でアルゴリズムモデルのバッチ生産と反復的なアップグレードを実現できます。

センスタイムはなぜこのような大規模な AI デバイスを構築しているのでしょうか?

センスタイムの徐立CEOは、AIアプリケーションを労働集約的なものから脱却させることが本質であると述べた。

彼は、AI は生産効率が低いため労働集約的であり、生産効率を向上させる鍵は生産要素のコストを十分に低く抑えることだと考えています。

AI導入の初期段階では、カスタマイズプロジェクトが業界で最も一般的なアプローチです。例えば、携帯電話検出アルゴリズムの開発には数百人規模のチームが必要ですが、異なるシナリオに合わせてアプリケーションモデルを変更するにはさらに数百人規模のチームが必要です…

さまざまなシナリオで家を建てるのと同じように、人を重ねることは問題を解決する一般的な方法です。

しかし、上記のようなプロジェクト運営では、AIの実用化は夢物語になってしまいます。

SenseTime のモデルは秘密ではありません。 「SenseTime はすべての業界を牽引し、力づけます」。 「1 (基礎研究) + 1 (製品とソリューション) + X (業界)」のアプローチを使用して、さまざまな業界にソリューションを実装します。

公式データによると、創業から6年間でセンスタイムは2,000人の研究開発チームを編成し、 13,000以上の技術モデルと17,000以上のビジネスモデルを立ち上げた。

したがって、複数のシナリオとさまざまな分野での大規模な実装のプロセスにおいて、一般的なモデルの要件が提唱されました。

しかし、問題も発生します。モデルが一般化すればするほど、トレーニングデータとモデルパラメータが大きくなり、結果として計算能力への要求が高まります。

GPT-3がヒットする前は、大規模なパラメータを持つこのような汎用モデルに対して、業界内外から疑問の声が上がっていました。

これまでのコンセンサスは、アルゴリズムが強力になればなるほど、必要なパラメータと計算能力が少なくなり、モデルの精度を向上させることが正しい方向であるというものでした。

さらに、この「精巧な」アルゴリズム的アプローチは、数学の問題を解く際のシームレスな導出プロセスのように、計算と実行のためにモデルが正確に展開され、最終的に正確な結果が得られることを意味します。

必要な計算能力は可能な限り少なくする必要があります。

問題を解決するために、大量のデータを消費し、大量の計算を実行し、最終的に結果を提供するという力ずくのアプローチは、たとえそれが正しい答えであっても、推奨されません。

センスタイムは創業以来、高度なモデルに重点を置き、携帯電話会社やインターネット企業に AI ソリューションを提供してきました。

しかし、規模が拡大し、B2B業界や都市型ビジネス分野に参入し始めると、業界のロングテールのニーズやアプリケーションにおける高度なテクノロジーモデルの欠点が露呈しました。

例えば、ビジネス実装においては、トラフィック量、可視性、利用頻度、そして投資収益率の高い主要アプリケーションが当然ながら優先されます。そのため、地下鉄の顔認証のようなアプリケーションをめぐっては、誰もが競争を繰り広げています。

都市部では、防火や防水といった用途は利用頻度が低く、蓄積や投資に必要なリソースも上位用途に劣りません。これらの用途は需要が高いものの、ロングテールに位置し、あまり好まれていません。

結局のところ、需要側の観点からすると、ロングテールを含む問題が単一のシナリオで解決できない場合、新しいソリューションに切り替えてそれにお金を払う意欲は低下するでしょう。

したがって、AI実装の商業化とバリューループの観点から、需要に牽引されて「すべてを一度に把握」し、大きなパラメータのモデルを開発することは自然なことです。

さらに、AI技術の進化に伴い、反コンセンサスの潮流がより多くの次元から現れてきました。

AlexNet 以降の過去 10 年間の AI モデルの発展を見ると、最新のアルゴリズム、ネットワーク、最高のテクノロジーにより、コンピューティング能力の需要は毎年桁違いに増加しており、年間およそ 10 倍になっています。

徐立も深く関わっており、この傾向をよく認識していました。

彼は、この傾向の理由は実は非常に単純だと考えています。つまり、表現がより豊かになり、モデルがより一般化され、パラメータが増加し、計算能力の要件が高くなっているのです。

全体的に、最も高度なアルゴリズムには、ほぼ 100 万倍の計算能力が必要です。

第二に、テクノロジー自体の進化です。

当初の技術的アプローチは、単一の方向と単一の道筋に沿って進んでいました。汎用AIは実現不可能と思われていましたが、ここ数年、一般的な問題を解決したいという切実なニーズに駆り立てられ、汎用言語モデル、汎用視覚モデル、さらには汎用マルチモーダルモデルがブレークスルーを達成し始め、かつては不可能だったことが可能になりつつあります。

センスタイムのCEOは、一般的なモデルの作成には多大な労力が費やされたことを認めたが、そのメリットはロングテール問題の解決に非常に効果的だったことだという。

付随する課題は、コンピューティング能力を中心とした新しい AI インフラストラクチャの波に対する需要です。

「物理学の探査と同様に、粒子加速器がなければ、多くの中核的なタスクを実行できません。」

徐立氏は、大規模AI導入の波の中で、センスタイムは汎用モデルの課題に対処し、集中型の大規模コンピューティング能力を備えている必要があると強調した。

彼は、SenseTime が 2016 年と 2017 年に大規模パラメータ モデルへの挑戦を開始し、SenseNet が 1,000 を超えるレイヤーで構築されたことを振り返った。

モデル ネットワークが深くなり、パラメーターが大きくなるにつれて、計算能力の問題がより顕著になります。

そのため、センスタイムは2018年からチップやハードウェアの検討をより本格的に開始し、独自のコンピューティングパワーセンターの構築を基盤として、大型デバイスの「プロトタイプ」の作成を完了しました。

その後、56億人民元を投資したAIDCインテリジェントコンピューティングセンターが建設を開始し、2021年末に引き渡されました。

もちろん、このプロセスの間に AI 分野で 2 つの大きな進歩も起こり、SenseTime の全員に安心をもたらしました。

2019年にOpenAIは大規模パラメータモデルの構築を開始し、2020年にはGPT-3が世界的な大旋風を巻き起こしました。

もう1つはDeepMindのAlphaFold 2です。

Xu Li 氏の見解では、これら 2 つの異なる方向への進歩は、実際には同じ核となる道を共有しています。

出力方向は大まかに決定できます。つまり、より大きなデータを入力し、結果を「バンプ」出力します。

そしてセンスタイムの大規模 AI デバイスは、まさにこの中核となる道、つまり AI 分野における粒子加速器のための実用的なマシンでありインフラストラクチャではないでしょうか?

大規模AIデバイスの用途は何でしょうか?

大きなパラメータを持つモデルを作成することが可能です。

まず、AI実装におけるロングテール問題を解決できます。

例えば、都市の日常的な統治において、「都市管理官」の業務シナリオは AI プロセスによって完全にカバーできます。

放置されたゴミの問題、無造作に積み上げられたシェア自転車の問題、あるいは疫病、火災、洪水、過密状態による群衆の暴走、有害化学物質の漏洩など、公共の場で発生するさまざまな問題など、高頻度および低頻度の問題にワンストップで対応できます。

発見と警報から実行とケースの終了まで、プロセス全体を AI で実行できるため、人間とコンピューターの相互作用を通じて、より効率的な都市ガバナンスが可能になります。

さらに、これは単なる仮説的なシナリオではなく、SenseTime が大規模な AI デバイス プロトタイプを使用して上海統合ネットワーク管理プロジェクトで実装した現実です。

2 番目は、大規模なパラメータ モデルをバッチで作成することです。

ビジネス シナリオに基づいて、都市、自動車、産業などの大規模なアプリケーションから、ネジやナットの認識、冷蔵庫内のアイテムの識別などの小規模なアプリケーションまでの範囲が広がります...

技術的な応用に基づいて、これらには、視覚、言語処理、自動運転、ヘルスケア、医薬品などが含まれます。

あらゆる分野において、十分な量のデータを入力し、大規模な装置を用いて衝突させ、結果を生み出すことは可能でしょうか?

例えば、タンパク質の構造予測の分野では、AI手法を使用する場合でも、生物学に精通した専門家とAIに精通した専門家の両方が協力する必要がありました。両者がプロセスを慎重に設計し、入力データを慎重に準備しなければ、正しい結果を得ることはできませんでした。

大型デバイスでは何が異なりますか?

タンパク質構造を予測するための大まかな正しい方向と目標は分かっていますが、入力データや手順を綿密に準備する必要はありません。実際には、知恵を絞ってあらゆる関連データを入力すれば、「大型装置」があらゆる可能性を尽くし、正しい結果を得ることができます。

したがって、このような方向で拡大することで、大規模な AI 導入の導入障壁が低くなります。

AIがさまざまな業界で応用され始めた当初から、主導権を握るべきはAIの博士号取得者か、それとも従来の業界のベテランかという問題は議論され続けており、いまだに合意が得られていません。

最も信頼できる答えは、統合と共生を強調した「両方」です。

しかし、統合が必要な場合、AIを理解し使いこなせる人材は従来の業界の人材に比べるとごくわずかであるため、導入の規模とスピードは当然大きく制限されます。

インフラストラクチャとしての大規模 AI デバイスは、本質的に AI 機能を入出力マシンおよびツールに変換します。

このツールは、あらゆる業界や分野の人が使用できます。

データ主導の考え方を持ち、目標と方向性を明確に定義し、潜在的なデータを見つける方法を知っている限り、大型デバイスは本質的に「カメラ」や「コンピューター」と何ら変わりなく、すべてツールです。

そのため、Xu Li 氏は、SenseTime が AI 教育を自社の事業の重要な部分とみなしているのだと述べました。

現在の教育では、成績を得るためには各ステップを厳密に推論して正しい結果を導き出す必要があると若者に教えていますが、将来的には、導出のプロセスを習得しなくても正しい結果を得る方法があるかもしれません。

必要なデータをうまく活用し、その操作方法と使い方を知った上で、そのデータを「デバイス」に投入して問題を解決します。

このため、柯潔や李世ドルのような次の囲碁の名人は必ずしも囲碁を学ぶ必要はないと考える人もいる。

実際、このような考え方に基づいて教育方法を再検討する必要がある。

結局のところ、今日私たちが称賛する「計算の天才」とは、暗算が最も得意な人ではなく、コンピューターツールの使い方を最もよく知っている人なのです。

もちろん、「大規模なAIデバイス」という発想を踏襲し、よりマクロな「世界の理解」へと拡張していけば、人類の法則の発見や認識も刷新されることになるのでしょうか?

人類は世界を理解し変革するためにどのようなモデルを使用するのでしょうか?

アリストテレスは演繹を唱えました。演繹とは原因と結果を重視した強い推論であり、直線的な進化・発展です。

しかし、ニュートンとアインシュタインの時代という別のモデルでは、飛躍的な進歩が見られました。

彼らがもたらした根本的な理論的躍進は、当時は単なる「仮説」に過ぎず、彼らのプロセスは後世の天才たちによる功績によってのみ証明された。

歴史の車輪の共通点は、基礎理論のあらゆる進歩が、より強力な発明と創造、そしてより高度な文明の波をもたらすことです。

徐立氏は、天才がもたらしたこの文明の飛躍を「神が頭を叩いた」と冗談めかして言う。

しかし、彼がさらに興味を持っているのは、次のプロジェクトが大規模なセットアップで撮影できるかどうかだ。

振り返ってみると、人類の科学的探究は常に既知のものから未知のものを推論することに基礎を置いており、必然的に「既知の知識」に限定されてきました。さらに、人類の歴史における多くの重要な発明や発見は、「意図せぬ成功」の結果でした。

しかし、大規模な AI デバイスによって提供される新しいパラダイムは、別の道を提供します。

未知の世界を探求するために、人間が既に理解している情報に頼る必要はありません。より多くの、より大量のデータを入力することで、物事の本質に近いパターンを発見できるかもしれません。

AI の究極のツール機能は、まさに人類が究極の法則や真実をどんどん発見するのを助けることではないでしょうか?

SenseTimeをリフレッシュ

最後に、大規模な AI デバイスの登場により、SenseTime を再検討する時期が来ています。

センスタイムってどんな会社ですか?

創設から6年、大きな注目を集めているが、その姿は依然として「漠然としている」。

センスタイムは成長率や資金調達の評価で頻繁に議論されており、「AIがあらゆる産業を強化する」という可能性と実現可能性についても常に議論されています。

さらに、その応用範囲は広く、その技術や製品は直接To Cではないため、世論では誤解されやすい。

しかし今、最新の成果の集大成であるAI大型デバイスの完成により、SenseTimeの過去と未来は完璧に繋がりました。SenseTimeの核心と限界、その堀、技術からビジネスへの持続可能性、そしてSenseTimeがもたらすAI革命はすべて、AI大型デバイスの中で完全に答えられます。

センスタイムは、大規模AIデバイスのコンセプトのもと、AI博士の専門知識を活用し、博士号を持たなくても使用できるAIツールを構築し、さまざまな分野に提供し、力を与えることができます。

電気が発見された後に発電機や発電所が果たした役割と同じです。

徐立氏は、2018年にこの開発方針を初めて大胆に構想した際、世論にさえ反する内容だったと明かした。しかし、センスタイムはプレッシャーに耐え、ハードウェアと基盤技術を徹底的に掘り下げ、ハードワークとディープワークに注力し、3年間を費やした。

それは夜明け前に山を登るようなものです。登っていることは分かっていますが、それが頂上への正しい道であるかどうかは分かりません。

幸いなことに、OpenAI の GPT-3、DeepMind の AlphaFold、そして業界大手によるますます多くの高パラメータモデルは、これが確かに未来への道であることをさまざまな側面から検証しました。

徐立氏はまた、社内計画によれば、ハードウェアコストが56億元のこのAIデバイスは、2年間の運用で投資を回収でき、2025年までに収益化段階に入ると明らかにした。

これはセンスタイムの将来に向けた長期的な中核競争力であり、この長期的な競争力を構築するための時間枠が障壁と堀を構成します。

さらに重要なのは、大型AIデバイスの登場により、AI活用のハードルがさらに下がり、デジタル化とインテリジェント化のプロセス全体がさらに加速されることです。

センスタイムの現在の北京オフィスは理想国際ビルにあります。ここは、技術革新からビジネス革新まで、先代の独創的なテクノロジー企業である百度にとって「幸運の場所」でした。

Xu Li 氏はまた、「大規模 AI デバイス」が SenseTime と AI 業界にもたらす変化を説明するために検索エンジンを例に挙げることも好んでいます。

彼は、今日のインターネットの繁栄は、検索エンジンが仮想空間内で高頻度、低頻度、高価値、ロングテールの情報をうまく結び付けてきたことによるものだと考えています。

しかし、現実の世界には、同様の「検索エンジン」はこれまで存在していませんでした。

現実世界には、未だ構造化されておらず、分析不可能な事柄が数多く存在します。しかし、大規模なAIデバイスが成功すれば、現実世界の構造化とデジタル化を加速させることが可能です。

論理的には、インターネットの発展における 2 つの中核技術である検索推奨は、現実世界で再現して適用できます。

さらに、インターネット経済によって創出された価値と比較すると、人間の経済活動と創造のはるかに大きな部分はもともとオフラインで行われていました。

そのため、Xu Li 氏は、AI が新たな段階、つまり技術革新サイクルから商業革新サイクルへの移行段階に入っていると確信しています。

「検索エンジンが登場したとき、その周りにスタートアップのエコシステムがありました。ビデオプラットフォームが登場したとき、その周りにビジネスのエコシステムがありました。」

センスタイムの共同創業者は、AIスタートアップは時代遅れなのかと多くの人から尋ねられると語った。

彼の答えはこうでした。

まさに適切な時期です。