HUOXIU

大規模なオープンソース モデルに基づいて独自のインテリジェント エージェントを構築するにはどうすればよいでしょうか? Moda Community が AI エージェント開発フレームワークを発表しました。

9月5日、アリババクラウド主導のAIモデルコミュニティ「ModelScope」は、オープンソースの大規模言語モデルに対応したAIエージェント開発フレームワーク「ModelScope-Agent」の新機能を発表しました。ModelScope-Agentを利用することで、すべての開発者はオープンソースのLLMをベースとした独自のインテリジェントエージェントアプリケーションを構築し、想像力と創造性を最大限に発揮することができます。ModelScope-Agentのコードはオープンソース化されました。

AIエージェントは現在、大規模モデリング(LSM)分野において最も注目されている研究分野の一つです。これは、大規模モデリング(LLM)を基盤とし、ツールを用いて特定のタスクを自律的に実行できるインテリジェントエージェントを指します。周知の通り、現在のLLMは機能に限界があり、主にテキストベースのタスクに優れています。AIエージェントは、他のモデルやソフトウェアと連携することで、動画生成モデルと連携して自律的に動画を生成したり、外部ソフトウェアと連携して人間のメール作成、チケット予約、オンラインショッピングを支援するなど、様々な複雑な現実世界のタスクを処理できます。

AIエージェントアプリケーションは、大規模モデルスタートアップにとって重要な分野となりつつあり、AIエージェント開発フレームワークの出現につながっています。しかし、既存のAIエージェント開発フレームワークのほとんどは、クローズドソースのLLM上に構築されています。オープンソースLLMの生産性を最大限に引き出すため、ModaコミュニティはオープンソースLLMに適合した独自のAIエージェント開発フレームワーク、ModelScope-Agentを開発しました。つまり、ModelScope-Agentは副操縦士ではなく、パイロットなのです。

Modaは以前、このフレームワークを用いてコミュニティ内でプロトタイプを「制作」し、ModeScopeGPTを構築していました。ModeScopeGPTは、自然言語でユーザーとインタラクトし、ユーザーコマンドを受け入れ、「中心モデル」であるTongyi Qianwenを介してコミュニティ内の多数のAIモデルAPIを呼び出すことで、人間が割り当てたタスクを自律的に完了することができます。ModeScopeGPTは25万回以上呼び出されています。

(ModelScope-Agent システムアーキテクチャ図)

AIエージェントのワークフローは、一般的にタスクの理解、計画、実行から構成されます。これらのうち、LLM(Limited Learning Model)はタスク計画、ツールの呼び出し、応答生成を担い、人間の脳のようにプロセス全体のインテリジェントな中枢ハブとして機能します。ModelScope-Agentでは、開発者がエージェントの「脳」を自由に選択でき、百川(Baichuan)や同義前問(Tongyi Qianwen)といった様々なオープンソースモデルに対応しています。主流のLLMは「プラグアンドプレイ」機能を提供しています。LLMのツール呼び出し機能を強化するためにLLMを特別にトレーニングする必要がある開発者は、ModelScope-Agentが提供するオープンソースのトレーニングデータ、トレーニング手法、最適化スキーム、評価手法を参照できます。

ModelScope-Agent開発フレームワークには、メモリ制御とツール使用のためのモジュールも含まれています。メモリ制御モジュールは知識検索とプロンプト管理をサポートし、ツール使用モジュールはツールライブラリ、ツール検索、ツールカスタマイズをサポートします。オープンソースの大規模モデルツールの呼び出し機能を強化するため、ModelScopeコミュニティは60万サンプルを含む独自のMSAgent-Benchツール呼び出しデータセットも開発しました。

ほとんどのAIエージェント開発フレームワークでは、手動でツールを追加する必要がありますが、ModelScope-AgentはModaコミュニティのオープンソーステキストベクターモデルを呼び出すことで、APIツール検索エンジンを構築します。これにより、AIエージェントはユーザーのコマンドに基づいて関連するツールを自動的に取得できます。開発者が外部ツール/APIを追加したい場合は、ModelScope-Agentにツールを登録するだけで、直接呼び出すことができます。

オープンソースは、多くの主要なモデルメーカーにとって選択肢となりつつあります。今後、ModelScope-Agentはより多くの新しいオープンソースLLMと互換性を持つようになり、パーソナルアシスタントエージェント、ストーリーエージェント、マルチエージェントなど、ModelScope-Agentをベースに開発されたアプリケーションをさらに多くリリースする予定です。Modaは、開発者の皆様にModelScope-Agentを使用して、工業製造、ゲーム開発、スマートコネクティビティなどの業界でのアプリケーション開発を推奨しています。

Modaコミュニティは、中国最大かつ最も活発なオープンソースAIモデルコミュニティとして、オープンソースを通じて大規模モデル技術とアプリケーションの開発を継続的に推進していくと述べました。アリババクラウドは以前、中国の大規模モデルエコシステムの繁栄を促進することを最優先事項とし、Modaを中国最大の大規模モデル無料マーケットプレイスにすることを目指していると述べていました。

ModelScopeAgent オープンソース アドレス: https://github.com/modelscope/modelscope-agent/