|
デジタル時代において、コスト削減と効率向上は企業にとって永遠の課題であり、テクノロジーはその中核的な原動力となっています。変革をもたらす技術として、生成AIは既に複数の分野でその可能性を示しており、今後、企業にさらなるイノベーションと価値をもたらすことが期待されています。 Dune Think Tank が金融、製造、IT/インターネット分野の企業の上級管理職 126 名を対象に実施した最近の調査によると、企業の約 60% が、生成 AI テクノロジーによって今後 1 ~ 2 年で従業員数を 1 ~ 5% 削減したいと考えていることがわかりました。 AIエージェントは、大規模モデルの「頭脳」とデジタル従業員の「手」を融合させ、タスクの自動実行、意思決定、そして周囲とのインテリジェントなインタラクションを可能にします。AIエージェントの普及は、企業や個人の時間と労働コストを大幅に削減し、業務効率を向上させ、企業の生産性革命をもたらし、コスト削減と効率向上という大きな目標を達成するでしょう。 2023年はビッグモデルの年であり、2024年はAIエージェントの年となります。AIエージェント市場は活況を呈しており、Dune Think Tankは企業がAIエージェント市場の全体像を迅速に把握し、技術開発のトレンドに追随できるよう、「2024年中国AIエージェント市場ガイド」を発表しました。 01 AIエージェントとは何ですか? AIエージェントとは、人工知能技術を用いてデジタル環境または物理環境において、知覚、意思決定、行動、そして目標達成を行う能力を持つ、自律的または半自律的な知的エンティティです。下図に示すように、AIエージェントはセンサーを介して入力を受け取り、ツール/アクチュエータを介して行動を起こします。様々な環境で動作可能です。 RPAなどの自動化ツールと比較すると、AIエージェントは複雑さと機能性のレベルが異なります。現在のRPAは、反復的なルールベースのタスクを自動化するために使用されるプログラムされたソフトウェアの一種です。RPAはトリガーに基づいて実行され、事前に定義されたスクリプトに従って、データ入力やファイル転送などの特定の機能を実行します。一方、AIエージェントはよりインテリジェントなシステムであり、タスクを自動化するだけでなく、ある程度のプロキシ機能も備えています。つまり、自律的に動作し、処理されたデータに基づいて意思決定を行い、経験から学習することができます。 大規模モデルの出現は、AIエージェントに「スマートブレイン」を提供します。大規模モデルによって駆動されるAIエージェントアーキテクチャは、計画、メモリ、ツール、アクションという4つの主要要素を含む、一般的なAIエージェント展開アーキテクチャです。 このアーキテクチャでは、エージェントが中心となり、さまざまなコンポーネントを調整して複雑なタスクと意思決定プロセスを処理します。 • 計画:エージェントは複雑なタスクを効果的に実行するために、計画能力(意思決定も含む)を必要とします。これには、サブゴールの分解、思考の連鎖、自己批判、過去の行動の反省などが含まれます。 • 記憶:これには短期記憶と長期記憶の両方が含まれます。短期記憶は文脈学習に関連し、キューイングエンジニアリングのカテゴリーに分類されます。一方、長期記憶は、典型的には外部ベクトル記憶と高速検索を通じて、情報の長期的な保持と検索を伴います。 • ツール:エージェントが呼び出す可能性のある様々なツールが含まれます。カレンダー、電卓、コードインタープリター、検索機能などです。これらのツールは非常に重要です。大規模なモデルを事前学習すると、その内部機能と知識の限界はほぼ固定され、拡張が困難になるためです。ツールはエージェントの能力を拡張し、コア機能を超えたタスクを実行できるようにします。 • アクション:エージェントは計画と記憶に基づいて特定のアクションを実行します。これには、外部世界とのインタラクションや、ツールの呼び出しによるアクション(タスク)の完了などが含まれます。 時間の経過とともに技術が進歩するにつれ、AIエージェントの複雑さは増大し続けるでしょう。同様に、LAM(Large Action Model)を用いたエージェント構築の新しい手法は、LLMなどの技術を補完、あるいは代替し、将来のAIエージェントアーキテクチャの中核となる可能性があります。 企業はAIエージェントの技術開発を常に追跡し、市場における様々な製品のポジショニングを把握する必要があります。現在、ネイティブAIエージェント企業、大手インターネット企業、ハイパーオートメーションメーカーなど、様々なテクノロジーベンダーがAIエージェント製品を提供しています。代表的なベンダーを下図に示します。 02 AI エージェントの使用例は何ですか? AIエージェントは、タスクの自動化、意思決定、そして環境とのインテリジェントなインタラクション能力を備えており、業界や環境に革命をもたらす可能性を秘めています。AIエージェントは、以下を含むあらゆるデジタル環境で動作するように構成できます。 • 消費環境:製品の販売または購入、顧客の独自のニーズを満たすソリューションの組み立て。 • 産業環境: プロセスを動的に最適化、実行し、プロセス間アクティビティを自動化します。 • 情報環境:意思決定や理解能力を向上させるために情報を分析、強化、整理、評価、要約する。 • クリエイティブ環境: マルチモーダルまたは多様なアセットの合成、最適化、生成。 • 社会環境:社会集団間の協力とコミュニケーションを効果的に促進する。 • 物流環境:輸送およびサプライチェーン管理。 これらの環境におけるAIエージェントの適用には、様々なAIエージェントインタラクションモードが関与します。例えば、 • 人間主導のプロセス。AI エージェントは人間のユーザーの指示に従って動作します。たとえば、製品の最新のマーケティング資料を生成したり、最新の機能強化、顧客のニーズ、過去のマーケティング キャンペーンのやり取りを組み合わせてマーケティング キャンペーンをサポートするためのマルチモーダル メディア アセットを作成したりします。 • ハイブリッドプロセス:人間のユーザーが1つ以上のAIエージェントタスクの特定の段階に参加するプロセス。例えば、旅行予約エージェントは旅程を特定してフライトを予約できますが、予約が完了する前に人間の確認が必要です。 • 隠れたプロセス。1 つ以上の AI エージェントが進行中の目標を完全に自律的に認識して処理し、分散物流システムの障害に反応するエージェントなど、外部監視の対象となります。 マルチエージェントシステム(MAS)は、複数の独立かつ相互作用的なエージェントで構成され、各エージェントは環境を感知し、行動を起こすことができます。これらのエージェントは、単一のエージェントの能力を超える共通の目標に向かって動作します。複数のエージェントを統合的に適用することで、単一のエージェントでは達成できない複雑なタスクを解決し、より適応性が高く、スケーラブルで、堅牢なソリューションを実現できます。MASは、分散型の意思決定が必要な環境にも使用できます。 マルチエージェントシステムは次のような用途に使用できます。 • ロボット: 倉庫の最適化、捜索救助、環境監視などに使用されるロボット群とドローン群。 • 生成 AI: LLM ベースのエージェントを調整して、CoT、ToT、またはより複雑な推論方法などの複雑なタスクやパターンを実行します。 • エネルギーと電力:スマートグリッドの最適化とエネルギー供給と需要の間の動的な負荷分散。 • 物流とサプライ チェーン: スケジュール、計画、ルーティング、交通信号制御、およびサプライ チェーン全体の最適化を最適化します。 • 通信:ネットワークの最適化と障害検出。 マルチエージェントシステムは、一般的にシングルエージェントシステムよりも設計が困難です。これらのシステムは予測不可能で自発的な動作を示す可能性があり、より堅牢なトレーニングとテスト、そして継続的な監視、追跡、そして文書化が必要となります。例えば、エージェント間の目標や相互作用が相反すると、望ましくない動作につながる可能性があります。 03 AI エージェントに関連する固有のリスクは何ですか? AIエージェントは自律的に動作し、通常は対象環境で動作しながら学習・適応するため、重大なリスクをもたらす可能性があります。企業は、AIエージェントに関連する以下の3つの固有のリスクカテゴリーに対処する必要があります。 カテゴリー 1: コンテンツの異常検出。 • 容認できないコンテンツまたは悪意のある使用; • 管理されていない企業コンテンツをエージェント経由で送信すると、機密データ入力が危険にさらされます。 • ビジネス上の意思決定やその他のプロセスに支障をきたす、虚偽または不正確な、違法な、著作権を侵害する、その他の望ましくない出力。 2番目のカテゴリはデータ保護です。 • 管理された環境または内部管理された環境でのデータ侵害。 • 外部ホスティング環境でプライバシーとデータ保護ポリシーを管理できない。 • サードパーティエージェントの「ブラックボックス」の性質により、プライバシー影響評価を実施し、さまざまな地域の規制に準拠することが困難です。 3 番目のカテゴリは AI エージェントのセキュリティです。 • 送信、通信、ペイロード、またはコンテンツを標的とした悪意のあるサイバー攻撃。 さらに、AI エージェントが権限を獲得し、モデルの錯覚、侵害リスク、サイバーセキュリティ、規制遵守など、より複雑なタスクや操作を処理するようになると、生成 AI の一般的なリスクは増大します。 |