|
4月21日、上海データサイエンス重点実験室、Daguan Data、上海浦東ソフトウェアパークが共同で開催した「大型モデル産業発展セミナー」が盛況のうちに終了しました。このセミナーは、Daguan Dataが北京と成都で開催した「ChatGPTと大型モデルテーマセミナー」に続く、新たな重要な技術イベントとなりました。このセミナーでは、大型モデル分野の国内外のトップエキスパートや産学官の学者が一堂に会し、業界の最新の進歩と将来計画を共有し、今後の発展の動向と課題について共同で議論しました。 上海浦東ソフトウェアパークベンチャーキャピタルマネジメント株式会社の取締役兼ゼネラルマネージャーである郭斌氏が講演しました。 上海浦東ソフトウェアパークベンチャーキャピタルマネジメント株式会社の郭斌董事長兼ゼネラルマネージャーは挨拶で、上海浦東ソフトウェアパークは「一核三園二港」発展戦略の重要な構成要素として、「技術革新と産業発展」という中核理念を一貫して堅持し、次世代情報技術産業の発展を積極的に推進し、産業エコシステムの構築に努め、データ技術革新と専門サービスの優位性を創出し、産業のインテリジェント化を推進してきたと述べました。郭氏は、今回の会議での交流と議論を通じて、参加者が大規模モデルの概念と応用についてより深く理解し、「大規模モデル+産業」時代の発展法則と動向を把握し、企業のイノベーション、産業の高度化、そして社会の進歩に新たな原動力を注入することを期待しています。 上海データサイエンス重点実験室所長の肖陽華氏が開会の辞を述べた。 上海データサイエンス重点実験室所長の肖陽華教授は、主催者を代表して「我が国の大型模型産業の発展に関する考察」と題した基調講演を行いました。肖教授は、汎用人工知能(GPAI)時代が到来し、かつてない産業変革をもたらしていると指摘しました。国際的な大型模型産業のエコシステムは急速に発展している一方、我が国のエコシステムはまだ初期段階にあります。業界は断片化しており、多くの大型模型は統一的な計画、協力的な支援、法的な保障を欠いています。深刻な均質化、海外の大型模型への依存度が高いこと、国内のコンピューティングパワーエコシステムの未発達、中国のデータの質の低さと規模、大型模型人材の不足、そして導入コストの高さなどが問題となっています。肖教授は、「大型模型産業の発展のあり方」について、皆様が積極的に検討に参加していただきたいと願っています。 テーマ共有セッションでは、Daguan Dataの会長兼CEOであるChen Yunwen氏、中国情報通信研究院クラウドコンピューティングおよびビッグデータ研究所人工知能部門の副部門長であるDong Xiaofei氏、AishuのR&D担当副社長のYang Yu氏、Supersymmetryの創設者兼主任科学者のWu Hengkui氏、ZhipuのAI大規模モデル事業部門のVPであるXue Yufei氏、Wenyin Interconnectの創設者であるBao Jie氏など、人工知能分野の専門家が、Xiao Yanghua教授の提起した質問に対する見解を共有し、大規模言語モデルの技術開発、応用、将来の展望について多角的に議論しました。 Daguan Dataの会長兼CEOであるChen Yunwen氏は、「大規模言語モデルのための垂直トレーニング手法とアプリケーションの探求」と題する講演を行いました。 Daguan Dataの会長兼CEOであり、復旦大学でコンピュータサイエンスの博士号を取得した陳雲文氏は、大規模言語モデルの垂直学習技術と応用に関する研究について洞察を共有しました。陳雲文氏は、パラメータスケールと言語モデルパラメータスケールに関する議論、汎用大規模モデル向け事前学習データセットの研究、垂直ドメインプロンプティングエンジニアリング、Daguan「Cao Zhi」システム、そしてDaguan DataのAIGCアプリケーションなど、Daguan Dataの垂直ドメイン言語モデルにおけるエンジニアリング研究の詳細を説明しました。また、金融特化型大規模モデルBloombergGPTの開発と応用についても紹介しました。陳雲文氏は、垂直ドメインにおける大規模モデルとAIGCの応用を深め、企業の実務に大規模モデルとAIGCを真に統合することが、商業化と大規模言語モデル研究の両面において非常に重要であると考えています。Daguan Dataは現在、垂直ドメインモデル「Cao Zhi」システムとAIGCアプリケーションを開発しており、将来的には様々な業界に導入され、各業界の発展に貢献していくと期待しています。 「曹植」大型モデルは、曹植が七段で詩を詠んだという故事にちなんで名付けられ、垂直型、特化型、国産のGPTモデルとなる予定です。 中国情報通信研究院(CAICT)クラウドコンピューティング・ビッグデータ研究所人工知能部門副部長の董小飛氏は、「CAICTの大規模モデル標準と評価の紹介」と題する講演を行いました。 中国情報通信研究院(CAICT)クラウドコンピューティング・ビッグデータ研究所人工知能研究部の董小飛副部長は、CAICTの現在の標準開発、評価、試験の進捗状況、そして今後の作業計画について詳細な概要を説明しました。董氏は、CAICTは業界の発展動向に合わせて大規模モデル標準システム2.0を構築しており、草案作成プロセスが着実に進んでいると述べました。「大規模事前学習モデル技術とアプリケーション評価方法」シリーズなど、大規模モデルの「構築、利用、管理」という業界のニーズに対応する複数の標準が既に発表・完成しており、評価と試験が全面的に進められています。同時に、「大規模事前学習モデル技術と製品評価方法」、「自然言語処理技術と製品評価方法」、「生成人工知能技術と製品評価方法」シリーズの標準と連携し、大規模モデル向けの特別評価プログラムが開始され、様々な分野への導入を導いています。 CAICT は、大規模モデルのフルスタック評価機能を強化し、協力的で双方にメリットのある評価エコシステムを構築します。 Aishu の R&D 担当副社長 Yang Yu 氏は、「大規模言語モデルによるフルドメイン データの価値の解放」と題した講演を行いました。 Aishuの研究開発担当副社長であるヤン・ユー氏は、「大規模言語モデルによるフルドメインデータの価値の解放」と題した講演を行いました。同氏は、ドメイン特化型の大規模モデルとドメイン知識について紹介し、一般的な大規模モデルは、化学工学、証券、政府といった垂直産業向けのドメイン特化型大規模モデルへと分割されると述べました。さらに、大規模モデルは構築コストを削減し、ドメイン知識ネットワークの品質を向上させることができると述べました。 言語モデルの科学的発見への応用に関する講演で、Supersymmetryの創設者兼チーフサイエンティストである呉衡奎氏は、ビッグバン・トランスフォーマー・モデル(BBTモデル)の詳細を紹介しました。BBT-Scienceモデルは、数千億のパラメータを持つBBT汎用モデルを基盤として構築され、科学コーパスでさらに学習された大規模モデルです。物理学、化学、生物学、数学など、様々な分野における知識に基づく質問応答に応用できます。研究者に迅速かつ正確な知識検索を提供し、それぞれの研究分野における最先端の課題に対する新たなアイデアを提供し、多分野にわたる知識で訓練された能力を用いて、学際的な示唆や洞察を提供することができます。 ZhipuのAI大規模モデル事業部門の副社長である薛玉菲氏と、WenYin Interactiveの創業者である包潔氏は、オンライン接続で共有セッションに参加しました。薛玉菲氏は、オープンソースの大規模多言語コード生成モデルであるCodeGeeXを紹介しました。CodeGeeXは現在、Python、Java、C++、JavaScript、C、Go、HTMLなどの主流言語を含む23のプログラミング言語をサポートしており、プログラマーのコード作成をより良く支援します。包潔氏は共有の中で、企業が独自の大規模モデルを持つことは、自社のビジネスモデルと運営メカニズムをより深く理解し、戦略と意思決定をより適切に策定し、業務効率と競争力をより効果的に向上させるのに役立つため、企業にとって不可欠であると述べました。 円卓討論では、復旦大学コンピュータ科学技術学院研究員兼博士課程指導教員の李志旭氏、上海交通大学人工知能研究所主任エンジニアの金耀輝氏、復旦大学人工知能イノベーション・産業研究所研究員の程元氏、ベル研究所研究員の林寛氏、復星グループAI事業部長の邵浩氏、小愛ロボット副社長兼研究所長の陳成才氏、易達科技共同創業者の肖明林氏が、「国内『ChatGPT』と大規模モデル研究の現状と今後の展開」をテーマに、活発な議論と交流を行いました。 座談会:国内における「chatGPT」と大規模モデル研究の現状と今後の展開 専門家たちは議論の中で、国産「ChatGPT」と大規模モデルの開発方向性について合意に達した。「自然言語処理は、他の分野と比べて海外の先進企業との差がはるかに小さい。OpenAIを神話化するのではなく、対等に捉えるべきだ。世代間のギャップはあるものの、乗り越えられない溝ではない。追いつき、追い越す過程では、国産モデルに時間を与える必要がある」 会議の専門家たちは、技術的および実践的な観点から、ChatGPTが自然言語処理の上流から下流、そしてチップ全体にわたる思考と開発を牽引してきたと確信しています。大規模モデルは、ある程度、次世代のインフラとなる可能性があります。中国は、セキュリティ、同時実行性、安定性などを確保するために、独自の基本モデルシステムを必要としています。投資コミュニティ、学界、そして産業界は、冷静さを保ち、誇大宣伝に惑わされず、確かな成果を上げることに集中すべきです。 最後に、上海データサイエンス重点実験室、Daguan Data、UCloudが共同で開催する「大規模モデルイノベーション・創造応用コンテスト」の参加登録が開始されました。コンテストの賞金総額も正式に発表され、総額は7万元です。このコンテストは、様々な企業、技術グループ、技術愛好家、大学生の想像力と創造性を刺激し、最新の大規模モデル技術をより多くの分野、シナリオ、タスクに適用することで、価値あるアイデアを実現する機会を提供することを目的としています。同時に、各分野の専門家、技術チーム、企業がアイデアを交換し、協力するためのプラットフォームを構築し、人工知能技術の進歩を共同で促進することを目指しています。今すぐコンテストに参加しましょう! (登録するにはリンクをコピーして開いてください) |