著者 | アレクセイ・エヴドキモフ 編纂者:岳陽 目次01 以下に記載されている内容 02 品質基準が高い、または品質管理コストが高いアプリケーションは失敗する可能性があります。 03 プロの副操縦士が市場で人気を集めている✅ 04 わずかな利便性しか提供しないLLMアプリは機能しません🚫 05 LLM を既存のワークフローに巧みに統合するアプリは市場で人気が高まっています。✅ 06 GenAIを統合した製品は、B2CよりもB2B2Cに適しています。 07 要約 最近、頭に浮かんだ数多くの生成AI製品のアイデアのうち、どれを深く検討する価値があるのかをじっくり考えていました。そこで、ChatGPTに現在のAI製品(消費者向けB2Cと企業向けB2Bの両方)の成功と失敗の根本原因について質問するための、複数の異なるバージョンのプロンプトを設計しました。 これはGPT-4o [1] から受け取ったモデル応答です(キャプション内のリンクをクリックしてご覧ください)。プロンプトの応答には複数のバージョンがありますが、これが最も良いものだと思います。GPT -4oの応答に満足できる場合は、残りの応答はいつでもスキップできます。😉 完全な回答を見る: https://chatgpt.com/share/a08c7c15-726b-4dd8-b96b-395b80a96edd しかし、この表面的な答えでは、生成AIの独自の側面を捉えきれていません。理由は単純です。これは新興分野であり、GPT-4oの学習データでは、GenAI製品の成功要因に関する十分な情報がまだ提供されていないからです。 この場合、Google検索を直接使用するほど迅速かつ包括的ではないかもしれません。私が考える最も説得力のある詳細なコンテンツは次のとおりです。
どちらの論文も、データ品質の低さ(つまり、十分かつ高品質なコンテキスト情報の欠如)が、多くのAIプロジェクトが失敗する主な理由の一つであると強調しています。 「大規模言語モデルに入力されるデータの質が高いほど、モデルの応答性は向上する」ことは疑いようもありません。しかし、実際のアプリケーションでは、多くの対象タスクの処理と解決は大量のデータに依存するものではなく、簡潔なプロンプトと洗練されたドキュメントがあれば、生成AIは効率的かつ高品質に作業を完了できる場合が多いのです。 従来の人工知能と比較して、GPTシリーズモデルの事前学習機能は間違いなく大きな利点です。従来のAIは、特定のタスクごとに学習する必要があるという制約を受けることがよくあります。この利点を最大限に活用する必要があります。 01 以下に記載されている内容私は異なる視点を提示し、どの LLM ベースの製品が開発する価値があるかを探りました。
本稿では、ユーザー行動パターンに焦点を当てています。分析においては、革新的な製品に見られる一般的なパターンではなく、 LLM製品の独自の側面を明らかにすることに重点を置きます。 「どの生成型人工知能(GenAI)製品が開発投資に値するのか?」これは、音声テキスト変換(TTS)、テキスト音声変換(STT)、拡散変換といった大規模言語モデル(LLM)ではなく他の技術を使用する製品を除外したとしても、非常に広範な問いです。したがって、
この記事では、LLM ベースのソフトウェア製品 (エンドユーザー アプリ) に関する一連の関連する問題について説明します。
次に、大きな挫折を経験する可能性がある 2 種類のアプリケーションと、市場のテストに耐えることが予想される 2 種類のアプリケーションを分析します。 02 品質基準が高い、または品質管理コストが高いアプリケーションは失敗する可能性があります。LLM の推論結果は予測不可能であり、評価が困難です。 完全な PPT を表示するにはクリックしてください。 製品が当初ユーザーから肯定的なフィードバックを得たとしても、異なるユーザーグループ、あるいは同じユーザーであっても異なる状況では評価が大きく異なる可能性があります。さらに重要なのは、知識ベースが拡大するにつれて、以前は良好なパフォーマンスを示していたシナリオでもパフォーマンスが低下する可能性があることです。いわゆる「高品質」のLLMに切り替えたとしても、パフォーマンスが低下する可能性があります。 したがって、LLM ベースのアプリケーションのパフォーマンス品質を継続的に監視することが、その成功を確実にするための鍵となります。 製品のパフォーマンスを効果的に監視できず、モデルの自己評価だけではエラーを防止できない場合、その製品は市場で生き残るのが困難になる可能性があります。 (実際には、LLMが自らの出力の品質を真に評価できる実例を見つけるのは困難です。) 最終的には、製品のエラーに対するユーザーの許容度によって決まります。
03 プロの副操縦士が市場で人気を集めている✅大規模言語モデル(LLM)は体系的な思考能力に欠けており、複雑なコンテキストを完全に把握する能力には限界があります。LLMは、稀な状況、データ学習の範囲外の状況、あるいはシステムの規定パラメータから外れた状況への対応に苦労することがよくあります。そのため、LLMの出力は手動によるレビューが必要です(前述のモデル評価メカニズムを参照)。理想的には、製品ユーザーが人間の評価者として機能するべきです。 しかし、このモデルが機能するためには、ユーザーの出力品質に対する期待が合理的かつ非現実的なものでなければなりません。エンドユーザーはAIを、無条件に高品質のサービスを提供しなければならない外部プロバイダーではなく、アシスタントとして捉えるべきです。 こうした考察に基づき、市場では「AI副操縦士」という概念が受け入れられ始めています。「AI副操縦士」を単に「AIアシスタント」と同一視する人もいるかもしれませんが、私の意見[4]では、 「AI副操縦士」は実際には「AIアシスタント」ファミリーの高度なメンバーです。彼らの役割は情報やアドバイスの提供にとどまらず、設計した製品における一連の複雑な操作を自律的に完了させることも可能です。 AIコパイロットの多くは非常に機能が豊富で、多目的製品に組み込まれていることがよくあります。これらの製品は、単一のアプリケーションではなく、オープンプラットフォームのように機能します。例えば、GitHubはすべてのプログラマーのためのプラットフォームであり、Microsoft Office 365はすべてのオフィスワーカーと知識プロフェッショナルにサービスを提供しています。どちらもAIコパイロットを搭載しています。WindowsやiOSなどのオペレーティングシステムも、AIコパイロットの組み込みを実験しています。 AI Copilot。著者がRecraft.aiを使用して作成した画像 AIコパイロット市場は飽和状態にあるように見えるかもしれませんが、革新的な製品が生まれる余地はまだ十分にあると確信しています。しかし、AIコパイロットを開発するスタートアップは、GitHub Copilot XやShopify Sidekickといった業界大手の多機能化の目標を盲目的に追い求めるべきではありません。 真のチャンスは、特定の分野に特化した「AIコパイロット」にあります。彼らは、汎用的な「AIアシスタント」よりも効率的に専門家を支援できます。これを実現するのは決して容易ではありませんが、努力する価値はあります。 講師(専門家やコース作成者など)のトレーニング用に特別に設計された「AIコパイロット」を想像してみてください。このようなツールはChatGPTよりもはるかに優れており、コースの質を向上させるだけでなく、必要な作業量を大幅に削減します。
既存のプラットフォームに汎用的なAIアシスタントを組み込むテクノロジー大手に打ち勝つには、独自のAIコパイロットがターゲットユーザー層に、より価値の高い体験を提供する必要があります。そのメリットは、単なる漸進的なものではなく、変革をもたらし、影響力のあるものである必要があります。 次のセクションでは、なぜこのような視点が存在するのかを説明します。 04 わずかな利便性しか提供しないLLMアプリは機能しません🚫生成AIベースのアプリは斬新なユーザーエクスペリエンスを提供すると主張していますが、ほとんどのユーザーは、意識的か無意識的かを問わず、自分の習慣を変えることに消極的であるという事実を無視することはできません。私の意見では、「会話型UXデザイン」の利点は誇張されすぎており、大規模な言語モデルによって実現される「パーソナライゼーション」や「ユーザーニーズへの適応」は予測不能な動作をし、時には煩わしく感じることもあります。 想像してみてください。多くのLLM駆動型アプリケーションでは、ユーザーはテキストまたは音声コマンドを入力する必要があり、多くの場合、長々とした会話につながります。このチャットベースのインターフェースは斬新ですが、マウスクリックに慣れたユーザーにとっては、間違いなく使いこなすのに時間がかかります。音声チャットはこれらの欠点の一部に対処しているように見えますが、多くのユーザーはテキストチャットよりも使いこなすのが難しいと感じています。 もう一つの障害があります。大規模な言語モデルから高品質な出力を得るには、多くの場合、複数回の最適化反復が必要になります。これは、モデル自体の不完全性だけが原因ではなく、ユーザーが要件を洗練させていく中で、自然に反復的なニーズを生み出すためです。なぜこのようなことが起こるのかを理解するために、従来のワークフローと新しいワークフローの違いを比較してみましょう。
これらの課題を克服するために、新しい AI アプリケーションは、一般の人々の受け入れを得られるような魅力的な利点を示さなければなりません。 作業時間を10~30%しか節約できないのであれば、ユーザーにアプリを試用してもらうには到底足りません。なぜなら、人は自分の習慣を変えることに抵抗を感じるからです。この抵抗を克服するには、アプリによる効率性の向上は画期的なものでなければなりません。単なるわずかな改善ではなく、作業負荷を何倍も軽減するほどの効果がなければなりません。 さらに重要なのは、単に時間を節約するだけでは不十分だということです。ユーザーがなりたい自分へと変身するのを手助けするアプリを想像してみてください。例えば、AIを搭載したアプリは、平凡なスピーキングスキルを持つ人を、大きな影響力を持つ思想的リーダーへと変身させるかもしれません。 05 LLM を既存のワークフローに巧みに統合するアプリは市場で人気が高まっています。✅真に成功し効果的なアプリは、大規模な言語モデルと他の機能を完璧に組み合わせ、「ホールプロダクト」を形成できます。この概念は、ジェフリー・ムーアが著書『Crossing the Chasm』[5]で初めて提唱し、広く普及しました。彼は、エンドツーエンドでユーザーのニーズを満たす製品だけが、主流ユーザー(大多数)の支持を迅速に獲得できると考えています。コア機能のみを提供する製品、いわゆる「汎用製品」は、独自のソリューションを構築することを好むイノベーターやアーリーアダプターしか惹きつけないことが多いのです。 画像出典:thinkinsights.net インテリジェントな「製品全体」(訳注:前述の通り、大規模言語モデルと他の機能を完璧に統合した製品を指します)を構築するには、AI技術を統合するための巧妙で「スマート」なアプローチが求められることがよくあります。これは、LLMの様々な機能を単一のアプリケーションにシームレスに統合するだけでなく、異なるアプリケーション間のデータ転送チャネルを確立することも意味します。 Obsidianのようなパーソナルナレッジマネジメント(PKM)ツールを例に挙げてみましょう。これらは多くの場合、「経験豊富なユーザー」向けに特別に設計された「コア製品」(訳者注:前述の通り、コア機能のみを提供する製品で、「ジェネリック製品」とも呼ばれます)です。これらの製品のユーザーは、様々なプラグインや統合機能を用いて、ニーズに合わせて使い方をカスタマイズし、自ら活用することに熱心です。 しかし、パーソナルナレッジマネジメント(PKM)システムの可能性は、それだけにとどまりません。これらの製品は、頻繁に新しいコンテンツを制作し、インスピレーションが枯渇しても一貫したアウトプットを維持する必要があるコンテンツクリエイターやブロガー向けに設計されています。こうしたユーザーグループにとって、AI駆動型の機能を統合することで、PKMを「完全な製品」へと変貌させることができます。個人のナレッジベースを深く分析し、記事、動画、ソーシャルメディア投稿のためのインスピレーションやトピックの提案をプロアクティブに提供してくれるインテリジェントなシステムを想像してみてください。さらに、このツールは私たちと連携して、高品質な製品を改良していくことも可能です。 もちろん、独自の知識ベースをTextCortexやNotebookLMなどの汎用AIソリューションと統合することで、同様の結果を達成できるユーザーもいます。しかし、このDIYアプローチは機能面でまだやや不完全です。 このようなソリューションは、多くの場合、面倒に思えます。一方では、ある場所で知識ベースに「知識」を追加する必要がありますが、他方では、別のプラットフォームで貴重な知識を分析し、発掘する必要があります。 さらに、こうした設定操作は多くの場合テキストクエリに依存しており、これは間違いなく時間のかかる、精神的に負担の大きいプロセスです。一方、適切に設計されたPKMアプリケーションでは、ユーザーがボタンをクリックしたり、事前に設定されたプランに従ったり、特定のイベントに反応したりするだけで、価値の高いコンテンツの発見を促すことができます。このようなユーザーエクスペリエンス(UX)設計は、ユーザーの精神的な負担を大幅に軽減します。 したがって、新技術にオープンでリスクを負うことをいとわない「アーリーバード」と呼ばれるタイプの企業が開発したテクノロジー製品を、主流市場のユーザーに普及させるプロセスにおいては、製品のシンプルさ、使いやすさ、そして機能の完全性が最も重要な考慮事項となります。LLMの機能を、ユーザーが既に使い慣れ、信頼している製品に統合することで、これらの条件を満たすことができます。 しかし、すべての統合ソリューションがうまくいくわけではありません。私の意見では、最も成功する「スマート」なAIソリューションとは、既存のワークフローにシームレスに統合され、エンドユーザーが追加の手順を踏むことなくAIの利便性を享受できるソリューションです。つまり、新しいボタンやオプションバーを追加する必要はなく、AIの統合はユーザーの既存のエクスペリエンスを向上させることだけなのです。
3 番目のソリューションの例: Notion メニューバーの AI アクション オプション。 06 GenAIを統合した製品は、B2CよりもB2B2Cに適しています。さて、別のシナリオを見てみましょう。既存の収益性の高い製品を基盤とせずにゼロからスタートし、LLM技術を統合することで製品機能を強化しようとするシナリオです。私の意見では、LLMを中核機能とする全く新しいB2C製品を発売することは、多くの困難に直面するでしょう。以下では、2つの主要な問題について考察します。
適切に設計されたB2B2Cアプリケーションでは、これらの課題は大幅に軽減されます。これらのアプリケーションは、他の企業、特に中小企業(SMB)がB2C市場向けに真に価値のあるエンドツーエンド製品を迅速に開発できるよう支援することを目的としています。
ただし、プライベートに導入されたLLMをベースとしたB2B製品も、これらの問題を効果的に回避できます。ただし、B2Bソリューションの詳細な説明はこの記事の範囲外です。 さらに、 B2C製品が成功するには、大規模なユーザーベースが不可欠です。そのため、ユーザーに特定のスキルや高いエンゲージメントを求めてはいけません。これは、LLMベースのアプリケーションによくある弱点と真っ向から対立します。LLMベースのアプリケーションは、ユーザーに馴染みのない複雑な体験を提供することが多いからです(セクション4で説明)。 ユーザーが製品利用に比較的高い熱意を持っている場合、前述の弱点は克服されやすい。しかし、B2C分野では、この状況は通常、イノベーターやアーリーアダプターといった10~20%程度のユーザーにしか当てはまらないため、そのような製品が市場で広く普及する可能性は低い(この状況については第5節で考察する)。 対照的に、B2B2C モデルでは、より多くの潜在的ユーザーが高い熱意を示します。なぜなら、彼らにとって重要なのは「効率性の向上」だけでなく、製品の利益の増加でもあるからです。 ちなみに、 B2B の顧客は LLM と直接やりとりできますが、エンド ユーザーは複雑で扱いにくい LLM に直接直面することなく、これまでと同じようにスムーズで自然な製品エクスペリエンスを楽しむことができます。 07 要約LLM技術を統合した製品は、出力品質において重大な課題に直面する可能性があり、必然的に品質評価の困難に直面することになります(詳細は本稿第2章を参照)。これらの問題に効果的に対処または軽減できるかどうかは、ユーザーのエラー許容度と密接に関係しています。特に、「AIコパイロット」のユーザーはエラー許容度が高い場合が多く、このようなシステムへの多額の研究開発投資は完全に正当化されます(詳細は本稿第3章を参照)。 既に市場での地位を確立している製品開発者にとって、 LLM(ローカル管理システム)技術を統合し、ユーザーの習慣を考慮しながら製品価値を高めることは、より賢明な選択です。この戦略は、AI統合後に製品が「キャズムを乗り越え」、より多くのユーザーを獲得するのに役立ちます(この概念をより深く理解するには、この記事のセクション5をご覧ください)。 しかし、ユーザーに馴染みのあるインタラクションパターン、レイアウト、プロセスといった従来の製品設計原則に固執することは必ずしも現実的ではなく、革新的な製品にとって必ずしも厳格な要件ではないかもしれません。LLMを活用したアプリケーションは「会話型製品インターフェース」を採用する傾向があり、ユーザーに使用習慣の変更を求めます。この場合、以下のようなことが起こります。
確かに、特定の技術分野(LLM)と2つのビジネスモデル(B2CとB2B2C)に限定したとしても、製品の成功または失敗に影響を与えるすべての重要な要素を短い記事で包括的に紹介することは困難です。 読んでくれてありがとう! このブログを楽しんで、新しいことを学んでいただければ幸いです。 アレクセイ・エヴドキモフ AI実践主義者で、研究(博士号取得)、教育、ソフトウェア開発、プロダクトマネジメントのバックグラウンドを持つ。GenAIはアイデア創出のためではなく、作品の洗練のために使っている。😉 https://medium.com/@alexeye42 終わり 参考文献 [1] https://chatgpt.com/share/a08c7c15-726b-4dd8-b96b-395b80a96edd [2] https://www.reforge.com/blog/ai-products-arms-race#the-ai-survival-curve-where-lucrative-opportunities-live-93801b235d73 [3] https://www.visma.com/blog/which-ai-product-ideas-are-worth-exploring/ [4] https://www.blobr.io/post/ai-chat-ai-assistant-ai-copilot-ai-sidekick-guide-ai-definition [5] https://www.blinkist.com/en/books/crossing-the-chasm-en オリジナルリンク: https://ai.gopubby.com/what-llm-powered-products-are-worth-developing-ux-and-adoption-perspectives-d9efcf444d50 |
目次01 以下に記載されている内容02 品質基準が高い、または品質管理コストが高いアプリケーションは失敗する可能性があります。03 プロの副操縦士が市場で人気を集めている✅04 わずかな利便性しか提供しないLLMアプリは機能しません🚫05 LLM を既存のワークフローに巧みに統合するアプリは市場で人気が高まっています。✅06 GenAIを統合した製品は、B2CよりもB2B2Cに適しています。07 要約 |