著者 |ローレンツ・ホフマン=ヴェレンホフ 編纂者:岳陽 flux-dev で生成されたプロンプト メッセージは次のとおりです (ベージュ色の背景に赤い手書きのテキスト「4 つの AI エージェント パターン」が付いた水彩画を生成してください) 弊社では音声バーチャルアシスタント[1]の分野を積極的に展開しているため、関連する基礎知識を習得し、現在の開発状況を把握する必要があると感じています。 この記事では、AI エージェントの設計でよく使用されるいくつかの設計パターンについて説明します。 01 反射パターンこの設計パターンでは、エージェントが自身のパフォーマンスを分析し、改善できることが求められます。エージェントは自己評価を通じて、出力と意思決定プロセスを洗練させていきます。 出典: 著者 これは、少量のコードで実装できる比較的シンプルな設計パターンです。 次のシナリオでは、リフレクション デザイン パターンが一般的な Large Language Model (LLM) よりも優れています。
下の画像をご覧ください。言語モデルが対話応答とコード最適化の例で出力を徐々に改善していく様子がわかります。 出典: SELF-REFINE: 自己フィードバックによる反復的な改良 02 ツールの使用パターン出典: 著者 このモードのワークフローは次のとおりです。
テクノロジのトレンドをフォローしていて、GPT を使用したことがある場合は、特定のタスクを処理するときにこれらの手順を自動化できることにすでに気づいているでしょう。 LLM が数百または数千のツールにアクセスできるようになると、その機能は大幅に拡張されます。 例えば、Gorilla[2]は、LLMがAPIを呼び出すことでツールを利用できるようにします。自然言語クエリを処理すると、Gorillaは意味的および構文的に適切なAPIを見つけることができます。 Gorilla を使用すると、1,600 回を超える (そしてその数は増え続けています) 機械学習 API 呼び出しを実行できます。 コマンドラインインターフェース(CLI)を使えば、自然言語を使って様々なタスクを実行できます。例えば… $ gorilla は test.txt というファイルに 100 個のランダムな文字を生成します。 次に、CLI コマンドが表示されます。 cat /dev/urandom | tr -dc 'a-zA-Z0-9' | fold -w 100 | head -n 1 > test.txt 03 計画パターンこのモードのワークフローは次のとおりです。
出典: 著者 HuggingGPTはプランニングパターンの一例です。大規模言語モデル(LLM)をHugging Face[3]プラットフォーム上の豊富なモデルエコシステムに接続します。 04 マルチエージェントコラボレーション出典: 著者 このモードのワークフローは次のとおりです。
現状では、技術が未成熟なため、マルチエージェントシステムの実世界への応用は未だ進んでいません。私がよく知る例としては、CEO、CTO、エンジニアといった役職を持つ仮想キャラクターで構成されたソフトウェア企業ChatDev[4]が挙げられます。 Andrew Ng は、「計画」と「マルチエージェントコラボレーション」のパターンを予測不可能なタイプに分類しています。
Andrew Ng 氏の見解によれば、現時点では、最初の 2 つのモデルが既存の生産システムに採用される可能性が高いようです。 読んでくれてありがとう! このブログを楽しんで、新しいことを学んでいただければ幸いです。 著者について ロレンツ・ホフマン=ヴェレンホフ 👨💻 Cresta 🇺🇸のソフトウェアエンジニア。オーストリア🇦🇹で生まれ育ち、ニューヨーク、ベルリン、そして現在はドバイ🇦🇪に住んでいます👀 テクノロジーと人生経験について書いています 終わり 今週のインタラクティブコンテンツ🍻 この記事で紹介されている4つのモデルのうち、どれが一番気に入っていますか?その理由も教えてください。 🔗記事内のリンク🔗 [1]https://cresta.com/blog/announceing-cresta-voice-virtual-agent-what-sets-it-apart-what-the-market-is-getting-wrong/ [2]https://gorilla.cs.berkeley.edu/ [3]https://hugginggpt.space/ [4]https://github.com/OpenBMB/ChatDev オリジナルリンク: https://lorenzhw.substack.com/p/4-ai-agent-patterns-you-should-know |
01 反射パターン02 ツールの使用パターン$ gorilla は test.txt というファイルに 100 個のランダムな文字を生成します。 cat /dev/urandom | tr -dc 'a-zA-Z0-9' | fold -w 100 | head -n 1 > test.txt 03 計画パターン04 マルチエージェントコラボレーション |