この記事は、7月7日に開催された世界人工知能大会の「AI世代と垂直型大規模言語モデルの無限の魅力」フォーラムにおける、中国工程院院士、復旦大学フィンテック研究所所長の柴宏鋒氏による基調講演「フィンテックを支える大規模モデルの考察と展望」をまとめたものです。金融垂直モデルの構築、金融ナレッジグラフと大規模モデルの統合、金融大規模モデルの規制という3つの側面からこのテーマを紹介しています。 フィンテックの急速な発展に伴い、金融業界は革命的な変革を遂げています。垂直金融モデリングと金融データの統合は、フィンテックの革新と発展にとって重要な原動力となっています。学際的な研究とシステムアプローチを統合することで、金融システムの全体的かつ複雑な性質を探求し、単一点の技術革新にとどまらず、フィンテックの画期的な進歩を推進することが可能になります。ビッグデータ、人工知能、機械学習といった技術の発展により、人々は様々な異種データをより迅速かつ効率的に取得、分析、保存、共有、統合することが可能になります。 しかし、金融分野における大規模モデルの適用には依然として課題が残っています。金融データと知識のプライバシーは、大規模データセットの共有・構築を制限します。さらに、金融データのマルチモーダル性は、モデル処理とモデリングの複雑さを増大させます。これらの課題を克服するには、産業界、学界、研究機関の連携を強化し、金融分野向けのより堅牢な基盤モデルを共同で構築し、大規模モデルによるマルチモーダルデータの表現能力を向上させることが不可欠です。 I. 垂直金融セクターモデルの構築 財務データと一般的な大規模モデルを組み合わせる フィンテックの台頭は金融業界を変革しており、フィンテックにおけるブレークスルーは金融セクターのイノベーションと発展を推進する上で不可欠です。これらのブレークスルーを達成するための主要な前提条件は、包括的なアプローチとシステム思考です。金融システムはオープンで複雑かつ大規模なシステムであるため、個々の技術革新だけでは全体的な改善を達成することは困難です。したがって、重要かつ重大な問題を解決するための出発点として、学際的な研究とシステム手法が不可欠です。 システム認知とは、システム要素の構成、相互作用メカニズム、そして結合効果を検証することで、問題の解決策を探求することです。金融と実体経済は一体となって形成されており、金融分野における科学的ブレークスルーは、単一要素思考を超え、資源の活用、業務効率、システムのレジリエンス、そして持続可能性といった全体的な側面を考慮する必要があります。 データサイエンスと情報技術は、金融分野における戦略的かつ極めて重要な技術です。データサイエンスと分析の進歩は、金融研究と知識の応用における大きな飛躍的進歩の機会をもたらしました。ビッグデータ、人工知能、機械学習といった技術の発展は、異種データの収集、分析、保存、共有、統合のためのより迅速な機能と分析手法を提供してきました。データサイエンスと情報技術は、複雑な問題の解決能力を大幅に向上させ、動的に変化する状況下でのデータ自動統合とリアルタイムモデリングを実現し、データ主導のインテリジェントな管理と制御を促進します。 ヒューマンマシンハイブリッドインテリジェンス技術は、金融分野の発展を革新的に推進する原動力となるでしょう。この技術は、自然言語処理、機械学習、コンピュータービジョン、音声認識、インテリジェントレコメンデーションなど、複数の分野を網羅しています。これらの技術の発展により、ヒューマンマシンインタラクションはよりインテリジェントになり、金融分野におけるヒューマンマシンハイブリッドインテリジェンスの応用は拡大しています。ChatGPT、MOSS、ChatGLMといった最新の大規模モデリング技術は、現在、金融分野との統合において注目されています。 財務データ基盤の構築には、様々な種類のリアルタイム財務データ、分析を必要とする様々な文書、様々な非構造化データ、そして高度に凝縮されたテキストが含まれます。こうした膨大な量の垂直的な財務データは、大規模な財務モデルを支えるデータ基盤となります。 金融垂直セクター向けの大規模モデルの構築において対処する必要がある主な問題は次のとおりです。
しかしながら、大規模モデルは金融垂直分野において、まだ創発的な効果を明らかにしていません。これは、金融データと知識のプライバシーが共有を困難にし、大規模データセットの構築を妨げていることが一因です。金融垂直分野におけるより強固な基盤モデルを構築するには、産学研究機関間の連携強化が不可欠です。さらに、金融データの多様なモダリティは、統一的な処理とモデリングを困難にしており、現在の大規模モデルは、これらのマルチモダリティを表現する能力において依然として改善の余地があります。 II. 知識グラフと大規模モデルの統合について 知識駆動型アプローチとデータ駆動型アプローチの相互作用 これまでの研究で、私たちは金融ナレッジグラフシステムを構築してきました。そのプロセスは主に、研究報告書や財務諸表といった様々な非構造化テキスト情報から多元的な異種知識を抽出し、エンティティアライメントやエンティティ曖昧性解消といった知識融合手法を用いて大規模で複雑な金融ナレッジグラフを改善し、分散グラフデータベースを通じてグラフデータを保存することで、後続の分散グラフアルゴリズムの開発と応用を容易にしています。このように構築された金融ナレッジグラフは、大規模モデルの時代においても、依然としてかけがえのない用途を持っています。 ナレッジグラフはかつて明示的知識の象徴的な表現でしたが、大規模モデルは暗黙知の新たな表現です。大規模モデルの時代において、既に構築された膨大なナレッジグラフを完全に放棄することはできません。ナレッジグラフは、大規模モデルが業界を的確かつ正しく理解できるように導き、理解力、推論力、意思決定能力を向上させます。同時に、ナレッジグラフと専門家の知識ベースによる問題解決パラダイムを、統計学習に基づく大規模モデルパラダイムと統合することで、領域における創発能力の創発をより効果的に促進する必要があります。静的および動的ナレッジグラフの両方を用いたナレッジグラフに代表される知識駆動型手法と、大規模モデルに代表されるデータ駆動型手法を継続的に相互作用させ、複数のモードを駆使することで、ナレッジグラフと大規模モデルの完璧な融合を実現する必要があります。これにより、人間と機械の協働を通じて複雑な現実世界の問題を解決し、人間やコンピュータだけでは認知プロセス中に発見することが困難な新たな知識を発見することが可能になります。 III. 大規模金融モデルの規制 セキュリティの観点から大規模モデルの展開問題を解決する 垂直産業における金融データと大規模モデルは密接に関連しており、データセキュリティ、大規模モデルの安全性と信頼性、倫理といった課題が生じます。さらに、金融セクターは機密情報や意思決定に関わるため、大規模金融モデルの規制は不可欠です。
具体的には、データセキュリティと著作権セキュリティの2つの側面に分けられます。 データセキュリティ:
著作権保護: 著者紹介 チャイ・ホンフェン 中国工程院院士、復旦大学フィンテック研究所所長・教授、博士課程指導教員 |