HUOXIU

MiniMaxのヤン・ジュンジエ氏:国内モデルはGPT-4よりはるかに劣る;OpenAIはハッカーによる内部システムへの侵入を隠蔽 | AIデイリー

記事のおすすめ

米国をはるかに上回る!中国、AI特許件数で世界1位!SenseTime、1分間の動画生成も可能なエンドユーザー向け大規模モデル「Vimi」をリリース! | AIデイリー

国内のAI大規模モデル「ユニコーン」企業であるMiniMaxの創業者、ヤン・ジュンジエ氏:現在、モデルのエラー率は60%~70%で、GPT-4の30%~40%よりもはるかに低い。

7月4日午後、世界人工知能大会産業発展メインフォーラムで、国内のAI大型モデル「ユニコーン」企業であるMiniMaxの創業者兼CEOであるヤン・ジュンジエ氏は、多くの国内企業がChatGPTに追いつきつつあるものの、同モデルの現在のエラー率は60%~70%で、GPT-4の30%~40%を大きく下回っていると述べた。

ヤン・ジュンジエ氏によると、大規模モデル全体のエラー率を下げることが現在最も重要な課題です。学習効率の向上、新たなネットワーク構造の研究、そしてより良いアライメントの実現など、6ヶ月から1年以内に大規模AIモデルのエラー率を1桁まで下げ、真に人間の作業を支援する役割を果たすことを目指しています。

会議後、ヤン・ジュンジエ氏はTitanium Media AGIなどのメディアに対し、WeChat、Douyin、Toutiaoのような規模の「キラーアプリ」は少なくとも3年間は登場しないだろうと語った。

AI時代の最大のアプリになる可能性はまだ十分にあると思いますが、アプリ自体がまだそこまで大きくない。何かが主流になるまでには3年かかるかもしれないけれど、それはそれでいい。最初にやってみて、能力やリソース、技術力が向上していけば、きっとできるようになる。一歩ずつ進んでいくので、(キラーアプリは)少なくとも3年はかかると思っています。

StepStar は、数兆個のパラメータを持つ GPT-4 に迫る性能を誇る、Step シリーズの大規模モデル製品を 3 つリリースしました。

7月4日に開催された2024年世界人工知能大会及び人工知能グローバルガバナンス大会(WAIC 2024)に、Step-Leap Starが初めて参加し、兆パラメータMoE(ハイブリッドエキスパート)大規模言語モデルStep-2、マルチモーダル大規模モデルStep-1.5V、画像生成大規模モデルStep-1Xの正式版をリリースした。


Step-2 兆パラメータ言語モデルの正式版は、MoE ハイブリッド エキスパート モデル アーキテクチャを採用しており、数学的ロジック、プログラミング、中国語知識、英語知識、指示の遵守という点で、ユーザー エクスペリエンスは GPT-4 に近いです。

複数のエキスパート間でのパラメータ共有や異種エキスパート設計といった革新的なMoEアーキテクチャ設計により、ステップ2の各「エキスパートモデル」は完全に学習されます。パラメータの総数は兆単位に達するだけでなく、各学習または推論で有効化されるパラメータの数も、市場に出回っている一般的なDenseモデルのほとんどを上回っています。

新型マルチモーダル大型モデルStep-1.5Vは、マルチモーダル理解と生成における統合技術アプローチにおける急速な進歩を象徴しています。従来のStep-1Vと比較して、新型1.5Vは、知覚、推論、そしてビデオ理解機能において大幅な向上を実現しています。

Step-1X画像生成大規模モデルは、600M、2B、8B(80億)の3つの異なるパラメータバージョンを含むフルチェーンアプローチを備えた自社開発のDiTモデルアーキテクチャを採用しており、顧客に差別化されたコスト効率の高いオプションを提供します。

Wuwenxinqiong、初のシングルタスク1000キャロレート異種チップハイブリッドトレーニングプラットフォームをリリース

7月4日に開催された2024年世界人工知能大会および人工知能グローバルガバナンス大会(WAIC 2024)で、Wuwenxinqiongの共同創設者兼CEOである夏立雪氏は、大規模モデル向けのWuwenxinqiongの異種分散ハイブリッドトレーニングシステムを発表し、キロカロリー異種ハイブリッドトレーニングクラスターのコンピューティングパワー利用率が最大97.6%に達したと主張した。

さらに、夏立雪は、Infini-AIクラウドプラットフォームに数千枚規模の大規模異種チップの混合トレーニング機能を統合したことを発表しました。これは、単一のタスクで数千枚規模の異種チップの混合トレーニングを実行できる初のプラットフォームです。数万枚規模のスケーラビリティを備え、AMD、Huawei Ascend、Tianshu Zhixin、Muxi、Moore Threads、NVIDIAなどの大規模異種チップの混合トレーニングをサポートします。

ウーウェンシンチオン氏は、「蛇口をひねる前に、水がどの川から来ているのかを知る必要はありません。同様に、将来、さまざまなAIアプリケーションを使用する際に、どの基本モデルを呼び出すのか、どのアクセラレータカードの計算能力を使用するのかを知る必要はありません。これこそが、最高のAIネイティブインフラストラクチャです」と述べました。

エヌビディアは今年、100万個以上のチップを出荷し、中国での売上高は120億ドルに達すると予想されている。

7月5日、NVIDIAは中国市場での売上高が120億ドルに達すると見込まれると発表した。

チップコンサルティング会社SemiAnalysisのレポートによると、Nvidiaは今年、中国市場に約120億ドル相当の人工知能チップを販売する予定だという。

同社は今後数か月以内に、中国で100万個以上のカスタマイズされたH20チップを出荷する予定だ。

これらのチップは特定の基準を満たすように設計されており、中国の顧客へのAIプロセッサの販売に関する米国の規制を受けることなく販売できます。H20チップの価格は1個あたり12,000ドルから13,000ドルです。

40705

OpenAIの内部メッセージングシステムがハッキングされた。

ハッカーがOpenAIの内部メッセージングシステムに侵入し、「技術的な詳細を盗んだ」ことが明らかになりました。OpenAIはこの件について、一般の人々やFBIには知らせず、従業員にのみ通知しました。

データ侵害は今年初めに発生したが、OpenAIは、この事件が国家安全保障に対する脅威となるとは考えなかったため、それを公表せず、FBIにも通知しなかった。

ニューヨーク・タイムズ紙に語った情報筋によると、ハッカーはOpenAIの従業員が技術について議論していたオンラインフォーラムから人工知能技術の詳細を盗んだという。