HUOXIU

蔡宏鋒院士:フィンテックを強化する大規模モデルに関する考察と展望

この記事は、7月7日に開催された世界人工知能大会の「AI世代と垂直型大規模言語モデルの無限の魅力」フォーラムにおける、中国工程院院士、復旦大学フィンテック研究所所長の柴宏鋒氏による基調講演「フィンテックを支える大規模モデルの考察と展望」をまとめたものです。金融垂直モデルの構築、金融ナレッジグラフと大規模モデルの統合、金融大規模モデルの規制という3つの側面からこのテーマを紹介しています。


フィンテックの急速な発展に伴い、金融業界は革命的な変革を遂げています。垂直金融モデリングと金融データの統合は、フィンテックの革新と発展にとって重要な原動力となっています。学際的な研究とシステムアプローチを統合することで、金融システムの全体的かつ複雑な性質を探求し、単一点の技術革新にとどまらず、フィンテックの画期的な進歩を推進することが可能になります。ビッグデータ、人工知能、機械学習といった技術の発展により、人々は様々な異種データをより迅速かつ効率的に取得、分析、保存、共有、統合することが可能になります。



しかし、金融分野における大規模モデルの適用には依然として課題が残っています。金融データと知識のプライバシーは、大規模データセットの共有・構築を制限します。さらに、金融データのマルチモーダル性は、モデル処理とモデリングの複雑さを増大させます。これらの課題を克服するには、産業界、学界、研究機関の連携を強化し、金融分野向けのより堅牢な基盤モデルを共同で構築し、大規模モデルによるマルチモーダルデータの表現能力を向上させることが不可欠です。


I. 垂直金融セクターモデルの構築

財務データと一般的な大規模モデルを組み合わせる


フィンテックの台頭は金融業界を変革しており、フィンテックにおけるブレークスルーは金融セクターのイノベーションと発展を推進する上で不可欠です。これらのブレークスルーを達成するための主要な前提条件は、包括的なアプローチとシステム思考です。金融システムはオープンで複雑かつ大規模なシステムであるため、個々の技術革新だけでは全体的な改善を達成することは困難です。したがって、重要かつ重大な問題を解決するための出発点として、学際的な研究とシステム手法が不可欠です。


システム認知とは、システム要素の構成、相互作用メカニズム、そして結合効果を検証することで、問題の解決策を探求することです。金融と実体経済は一体となって形成されており、金融分野における科学的ブレークスルーは、単一要素思考を超え、資源の活用、業務効率、システムのレジリエンス、そして持続可能性といった全体的な側面を考慮する必要があります。


データサイエンスと情報技術は、金融分野における戦略的かつ極めて重要な技術です。データサイエンスと分析の進歩は、金融研究と知識の応用における大きな飛躍的進歩の機会をもたらしました。ビッグデータ、人工知能、機械学習といった技術の発展は、異種データの収集、分析、保存、共有、統合のためのより迅速な機能と分析手法を提供してきました。データサイエンスと情報技術は、複雑な問題の解決能力を大幅に向上させ、動的に変化する状況下でのデータ自動統合とリアルタイムモデリングを実現し、データ主導のインテリジェントな管理と制御を促進します。


ヒューマンマシンハイブリッドインテリジェンス技術は、金融分野の発展を革新的に推進する原動力となるでしょう。この技術は、自然言語処理、機械学習、コンピュータービジョン、音声認識、インテリジェントレコメンデーションなど、複数の分野を網羅しています。これらの技術の発展により、ヒューマンマシンインタラクションはよりインテリジェントになり、金融分野におけるヒューマンマシンハイブリッドインテリジェンスの応用は拡大しています。ChatGPT、MOSS、ChatGLMといった最新の大規模モデリング技術は、現在、金融分野との統合において注目されています。


財務データ基盤の構築には、様々な種類のリアルタイム財務データ、分析を必要とする様々な文書、様々な非構造化データ、そして高度に凝縮されたテキストが含まれます。こうした膨大な量の垂直的な財務データは、大規模な財務モデルを支えるデータ基盤となります。



金融垂直セクター向けの大規模モデルの構築において対処する必要がある主な問題は次のとおりです。

  1. 多様なソースと異種の金融データに基づくデジタル金融インフラストラクチャを構築し、金融データの安全な共有と使用を確保します。

  2. 金融データ基盤と大規模モデルを統合する技術は、大規模モデル全般における知識不足や垂直分野における知識の相関性の問題を解決し、データに基づいてモデルをリアルタイムに更新・反復することを可能にします。

  3. フィンテックをベースとした大規模モデルにより、複数の分野でフィンテックを応用することが可能となり、金融垂直セクターの新たな可能性を示すことができます。



しかしながら、大規模モデルは金融垂直分野において、まだ創発的な効果を明らかにしていません。これは、金融データと知識のプライバシーが共有を困難にし、大規模データセットの構築を妨げていることが一因です。金融垂直分野におけるより強固な基盤モデルを構築するには、産学研究機関間の連携強化が不可欠です。さらに、金融データの多様なモダリティは、統一的な処理とモデリングを困難にしており、現在の大規模モデルは、これらのマルチモダリティを表現する能力において依然として改善の余地があります。


II. 知識グラフと大規模モデルの統合について

知識駆動型アプローチとデータ駆動型アプローチの相互作用


これまでの研究で、私たちは金融ナレッジグラフシステムを構築してきました。そのプロセスは主に、研究報告書や財務諸表といった様々な非構造化テキスト情報から多元的な異種知識を抽出し、エンティティアライメントやエンティティ曖昧性解消といった知識融合手法を用いて大規模で複雑な金融ナレッジグラフを改善し、分散グラフデータベースを通じてグラフデータを保存することで、後続の分散グラフアルゴリズムの開発と応用を容易にしています。このように構築された金融ナレッジグラフは、大規模モデルの時代においても、依然としてかけがえのない用途を持っています。



ナレッジグラフはかつて明示的知識の象徴的な表現でしたが、大規模モデルは暗黙知の新たな表現です。大規模モデルの時代において、既に構築された膨大なナレッジグラフを完全に放棄することはできません。ナレッジグラフは、大規模モデルが業界を的確かつ正しく理解できるように導き、理解力、推論力、意思決定能力を向上させます。同時に、ナレッジグラフと専門家の知識ベースによる問題解決パラダイムを、統計学習に基づく大規模モデルパラダイムと統合することで、領域における創発能力の創発をより効果的に促進する必要があります。静的および動的ナレッジグラフの両方を用いたナレッジグラフに代表される知識駆動型手法と、大規模モデルに代表されるデータ駆動型手法を継続的に相互作用させ、複数のモードを駆使することで、ナレッジグラフと大規模モデルの完璧な融合を実現する必要があります。これにより、人間と機械の協働を通じて複雑な現実世界の問題を解決し、人間やコンピュータだけでは認知プロセス中に発見することが困難な新たな知識を発見することが可能になります。



III. 大規模金融モデルの規制

セキュリティの観点から大規模モデルの展開問題を解決する


垂直産業における金融データと大規模モデルは密接に関連しており、データセキュリティ、大規模モデルの安全性と信頼性、倫理といった課題が生じます。さらに、金融セクターは機密情報や意思決定に関わるため、大規模金融モデルの規制は不可欠です。

  1. 金融分野における大規模モデルの適用が法的および倫理的要件に準拠することを保証する規制枠組みと基準を確立し、政府、産業界、学界、研究機関の協力を通じて関連する政策とガイドラインを策定します。

  2. 大規模な金融モデルの導入と利用には、協調的なガバナンス、透明性の向上、そしてデータの品質と解釈可能性を確保するメカニズムが必要です。これにより、ユーザーと規制当局はモデ​​ルの意思決定の根拠を理解し、偏見や差別のないモデルを保証できるようになります。

  3. 規制当局は、大規模な金融モデルの審査とリスク評価を強化し、主要な人員とシステムのパフォーマンスとセキュリティを確保するための審査とテストのメカニズムを確立する必要もあります。


具体的には、データセキュリティと著作権セキュリティの2つの側面に分けられます。

データセキュリティ:

  1. 大規模モデルの複雑さと規模は、攻撃を受ける可能性を高めます。さらに、大規模モデルの学習プロセスにはより多くのデータと計算リソースが使用されるため、悪意のある攻撃者がデータモデルを侵害したり改ざんしたりする機会が増えます。現在、大規模モデルは敵対的攻撃、バックドア攻撃、モデル盗難などの脅威に対して非常に脆弱であり、これらのリスクを軽減するための効果的な方法の探求が求められています。

  2. 大規模モデルが金融関連の質問への回答を支援する場合、ユーザーを特定できないため、高レベル情報や機密情報の漏洩などのリスクが生じやすくなります。そのため、大規模モデルの学習プロセスにおいて、データセキュリティレベルを厳密に定義する必要があります。

著作権保護
オープンソースの大規模金融モデルにおいては、悪意のある盗難や微調整が頻繁に発生しています。特定のデータを入力として用いることで、モデルは特定の入出力を通常のクラスとは異なる方法で識別することができます。この動作は、モデルの帰属を判断するために利用できます。最後に、蔡院士は、新たな歴史的出発点に立ち、新たな歴史的背景と発展パターンの中で、復旦大学フィンテック研究所はフィンテック発展の科学的課題に焦点を当て、国家の主要な戦略的ニーズ、根本的課題、そして原動力に取り組んでいくと述べました。産学研連携の強みを活かし、実体経済を支える金融の重要技術に取り組み、復旦大学の強みを活かして上海を国際金融センターおよび科学技術イノベーションセンターとして建設することに貢献していきます。


著者紹介

チャイ・ホンフェン

中国工程院院士、復旦大学フィンテック研究所所長・教授、博士課程指導教員