著者 |ルイ=フランソワ・ブシャール、フランソワ・ユプ=マルクー、オマール・ソラノ 編纂者:岳陽 本日は、関連性のある疑問について考察します。 「プロンプトは習得すべきスキルなのか、それとも単なる過渡期の要件なのか?」大規模言語モデル(LLM)が進化するにつれて(例えば、GPT-3からGPT-4o、そして現在はo1)、これらのモデルとの対話方法も変化しています。 プロンプトワードは依然として存在しますが、その複雑さは今後も続くとは限りません。この業界の状況がどのように進化し、日々人工知能を扱う私たちにとってそれが何を意味するのかを探ってみましょう。 01 プロンプトワードテクノロジーは長期的に存在するでしょうか?プロンプト技法、特に「高度な技法[1]」として耳にしたことがあるかもしれない「プロンプトチェイニング」「少量学習」「思考連鎖」技法などが注目を集めています。私たちは以前の記事[1]でこの点について明確に述べ、過度に複雑な技法の使用を批判してきました。なぜでしょうか?それは、大規模言語モデル(LLM)が進化し、複雑なプロンプト構造に頼るのではなく、人間のニーズに適応し理解する方法を学習しているからです。
モデルが継続的に最適化されるにつれて、複雑な指示への依存は減少し、コミュニケーションはより自然なものになるでしょう。大規模言語モデルが基本的な入力からより多くの情報を推論できるようになるにつれて、これらの高度な技術は徐々に廃止されることが予測されます。OpenAIのo1シリーズモデルはこの変化を実証しています。モデルの推論能力が向上するにつれて、複雑な指示の必要性も減少しています[2]。 インターネットの黎明期を思い出してみてください。当時は「インターネットの使い方」を教える書籍や講座が無数に存在していました。当時は複雑で斬新な技術が使われており、使いこなすにはスキルを習得する必要がありました。しかし今日では、Googleの使い方を学ぶのに特別な講座は必要ありません。Googleは驚くほど直感的でシンプルに使えるようになりました。 キューワードと大規模言語モデル(LLM)も同様のプロセスを経るでしょう。現在、高度なキューワード技術の習得は確かに役立ちますが、大規模言語モデルはユーザーに合わせて継続的に適応していきます。インターネットの閲覧に慣れてきたように、Google検索を使いこなせるようになったように、私たちは自然とそれらの使い方を習得するでしょう。 しかし、これはキューワードがなくなるという意味ではありません。キューワードの重要性は、もはや特定の技術的スキルを必要とせず、むしろ自分のニーズを明確に表現する能力へと移行していくでしょう。同僚とのコミュニケーションに似ています。綿密な指示を与える必要はありませんが、それでも自分のメッセージを明確に伝える必要があります。そして同僚と同様に、大規模言語モデル(LLM)はまだあなたの心を読むことはできません(そして、読むこともないでしょう)。 02 では、キューワードを使うことは本当に学ぶ価値のあるスキルなのでしょうか?答えはイエスであり、ノーでもあります。現在、効果的なキューワードテクニックを習得することで、大規模言語モデル(LLM)を用いたコミュニケーション体験を大幅に向上させることができます。しかし、このスキルは常に進化し続けています。 ChatGPTを例に挙げましょう。ChatGPTはメモリ機能(あなたに関する情報を自動保存する)を備えており、最終的にはあなたのスタイル、好みの情報源、さらにはプロジェクトの進捗状況まで把握します。まるで、あなた自身よりもあなたの習慣をよく知っている同僚と一緒に仕事をしているようなものです。キューワードの使い方が上手であることは今は役に立ちますが、このスキルの重要性はすぐに低下するかもしれません。 この問題をどのように捉えるべきでしょうか?大規模言語モデル(LLM)の進化について常に最新情報を把握しておくことは不可欠です。基本的なスキルは今日でも役立ちますが、「高度な技術」の習得を過度に強調する必要はありません。モデルが人間の意図をより深く理解するようになるにつれて、これらの技術は徐々に重要性を失っていく可能性があります。現在、最も優れたキューワード技術の一つと考えられている「思考の連鎖」が、O1の導入とともに徐々に姿を消したように。 03 では、もう一つ質問です... プロンプトエンジニアは本当に必要ですか?「キューワードエンジニア」の役割は多くの議論を巻き起こしてきました。彼らは特定の状況(AI駆動型アプリケーションの開発など)では非常に役立ちますが、すべてのケースで必要というわけではありません。多くの開発者や愛好家は、少しの試行錯誤でキューワードスキルを習得できます。
真の価値は、複雑なプロンプトを記述する能力ではなく、何を達成したいかを明確に定義することにあります。適切な評価基準を持ち、AI出力の成功度を測定する方法を理解することがより重要です。「プロンプトエンジニア」(あるいは単に経験豊富なユーザー)は、プロジェクトの初期段階ではサポートを提供するかもしれませんが、システムが稼働し始めると、通常の開発者がメンテナンスとパフォーマンスの調整を引き継ぐことができます。 ここで真のゲームチェンジャー、OpenAIのo1のようなモデルが登場します。o1はテストタイムコンピューティング[3]を用いて応答を最適化し、一連の指示に従うだけでなく、ターゲット要件を「推論」できるようになりました。モデルにターゲット要件の達成方法を指示する必要はもうありません。ターゲット要件[2]を設定するだけで、モデルが実装手順を自動的に生成します。 例えば、「新製品発売に向けたメールマーケティングのコピーを作成し、ソーシャルメディア戦略を立案し、各段階の詳細なタイムラインを計画する」といった段階的な指示ではなく、「この製品の包括的な発売計画を立てる」とシンプルに提案するだけで済みます。o1モデルは、メールのコピー、ソーシャルメディアコンテンツ、詳細なスケジュールを含む、包括的なアクションプランを自動的に生成します。このアプローチはインタラクションモデルを変革します。モデルは指示に応答するだけでなく、タスクをプロアクティブに計画し、実行します。
o1のような大規模言語モデル(LLM)の進歩により、ユーザー定義のステップからモデル駆動型実行への移行が進むでしょう。近い将来、個々のタスクごとにプロンプトを設計する必要はなくなり、モデルがほとんどの処理を担うようになるでしょう。 もう1つ明確にしておきたいのは、プロンプトの設計が得意だからといって、人工知能分野の専門家になれるわけではないということです。APIとプロンプトを組み合わせることと、その根底にある技術原理を理解することの間には大きな違いがあります。 真にAI主導のアプリケーションを構築するには、キューワードのスキルだけでなく、機械学習に関する深い知識が必要です。多くの場合、LLMを利用するアプリケーションは「AIアプリケーション」ではなく、APIを呼び出して言語モデルの応答を取得するだけのアプリケーションです。LLMを用いて強力なアプリケーションを構築するには必ずしもAIの専門知識は必要ありませんが、キューワードの設計と実際のAIの専門知識を区別することは依然として重要です。 04 結論として…(tl;dr)キューワード技術は消滅することはありませんが、大規模言語モデル(LLM)とのインタラクションはよりシンプルになります。現在必要とされる高度なキューワード技術は一時的なものです。将来的には、AIがユーザーのニーズをより深く理解し、複雑なキューワードの必要性は徐々に減少していくでしょう。重要なのは、常に情報を入手し、継続的に実験を行い、何を達成したいのかを明確にすることです。 皆様のご意見をお待ちしております。この見解に賛成ですか?それとも反対ですか?プロンプトワード技術をより効果的に活用する方法を学んでいますか?それとも、AIの急速な発展によってこれらのスキルはすぐに時代遅れになると思いますか?ぜひあなたの見解を共有してください! 読んでくれてありがとう! このブログを楽しんで、新しいことを学んでいただければ幸いです。 終わり 今週のインタラクティブコンテンツ🍻 AIモデルは常に進化していますが、正確なプロンプト技術が不可欠なシナリオはどのようなものだと思いますか?その理由は何ですか? 🔗記事内のリンク🔗 [1]https://highlearningrate.substack.com/p/mastering-advanced-prompting-because [2]https://x.com/swyx/status/1836805320795955525 [3]https://highlearningrate.substack.com/p/teaching-ai-to-think-the-self-taught オリジナルリンク: https://highlearningrate.substack.com/p/o1-and-the-future-of-prompting |
01 プロンプトワードテクノロジーは長期的に存在するでしょうか?02 では、キューワードを使うことは本当に学ぶ価値のあるスキルなのでしょうか?03 では、もう一つ質問です... プロンプトエンジニアは本当に必要ですか?04 結論として…(tl;dr) |