|
昨年11月30日、会話型AI「ChatGPT」が突如登場し、ソーシャルメディアを席巻して爆発的な人気を博しました。わずか5日間でユーザー数は100万人に達し、そのプラットフォームであるOpenAIは新たな高みへと躍り出ました。海外メディアの報道によると、マイクロソフトはOpenAIに100億ドルを投資し、同社の企業価値を290億ドルと評価する計画です。実際、ChatGPTを支える重要な要素は、大規模言語モデルと呼ばれる人工知能(AI)プログラムであり、その登場は会話型AI業界を活性化させました。 中関村科技金融(ZSTFE)は、会話型AI技術ソリューションを提供する中国の企業です。ITPUBとIT168は先日、ZSTFEの技術担当副社長である張傑氏にインタビューを行い、同氏が注力するAI技術の現状と今後の展望について伺いました。 2022年の会話型AIの開発動向を振り返ると、マルチモーダルと大規模言語モデルという2つのサブ方向に分けられます。 マルチモーダル技術が下位層市場に参入 張潔氏の観察によると、マルチモーダル技術は、方言ASR(自動音声認識)、ドメイン特化型ASR、特定動作認識といった、下位市場や垂直分業化されたシナリオに徐々に浸透しつつある。汎用モデルは商用アプリケーションのニーズを満たせないことが多く、カスタマイズモデルは開発コストが高くなる傾向がある。顧客にとっては、データのアウトソーシングもベンダーへの過度な依存も避けたいというジレンマがある。ベンダーにとって、カスタマイズモデルの開発は拡張性も収益性も低い。中関村科技金融は、ドメイン特化型およびカスタマイズモデルに対する市場の需要に応えるため、ゼロコードのオンライン自己学習型モデル最適化ツールの開発に投資してきた。顧客の業務担当者はモデルを自ら更新・反復できるため、双方の懸念を解消できる。 大規模言語モデルには大きな商業的可能性があります。 大規模言語モデルの人気は、テクノロジー業界にとどまらず、急上昇しています。張傑氏は技術トレンドについて議論し、2023年にはさらに多くの大規模言語モデルが登場し、基盤となるテクノロジー企業にとってのModel as a Service(MaaS)ビジネスモデルが促進されると予測しました。さらに、中堅テクノロジー企業にとっては、これらの大規模モデルから生まれる複雑な推論能力が、さらに革新的なアプリケーションを生み出すでしょう。 AIの大規模商用応用シナリオは大きな可能性を秘めています。多くの国内企業がデジタルトランスフォーメーションの過程で、単純反復作業をAIで代替する方法を議論する中、AIはすでにイラスト作成やコーディングの分野で活用され始めています。イラストレーター、メディア関係者、そしてプログラマーといったクリエイティブな仕事に携わる人々は、すでにAIの影響に直面しています。短期的には、AI技術は少なくとも検索エンジンや広告クリックに影響を与えるでしょう。将来的には、AIの生成能力と論理的推論能力を組み合わせれば、高品質なマーケティングコピー、オフィス文書、短編動画などを生成できるようになるかもしれません。これは、B2B分野で苦戦する国内テクノロジー企業にとって見逃すことのできない大きなチャンスです。中関村科技金融は、AIによるマーケティングコピーの作成、24時間365日体制での顧客からの問い合わせ対応、新入社員向けの実際の業務シナリオを模擬した没入型研修の提供、デジタルヒューマンによるオンライン商取引の実現など、対話型AIをエンタープライズサービス分野にどのように実装するかに焦点を当てています。 企業顧客にとっての会話型AIの価値 企業レベルでの会話型 AI の応用に関して、張傑氏は、企業顧客のニーズは主に以下のカテゴリーに分類されると指摘しました。 1. ビジネス成長のニーズ:多くのクライアントは、エンドユーザーの意図を正確に特定し、コンバージョン率を高めるシステムを重視しています。こうした製品は、アウトバウンドコールロボットや営業アシスタントといった形態をとる場合もあります。 2. コスト削減と効率性向上のニーズ: これらは主にカスタマー サービス センターのシナリオで発生し、エージェントの交代、苦情の削減、または二次マーケティングの機会の創出を目的としています。 3. 従業員研修のニーズ:一部のオフラインチェーン小売業者や労働集約型産業は、採用難や高い離職率といった課題に直面しています。新入社員が迅速にスキルを習得し、研修コストを削減する方法は、彼らにとって重要な課題です。低コストでナレッジベースを構築し、従業員向けにパーソナライズされたレビュー・分析レポートを作成できる製品が求められています。 4. プラットフォーム構築のニーズ: これらのクライアントは、多くの場合、すでに複数の AI プロジェクトを実装しており、「サイロの構築」や「車輪の再発明」を回避するためにプラットフォーム レベルで機能を統合する必要性を認識している金融機関や業界リーダーです。 エンタープライズ顧客は通常、製品を選択する際に次の側面を考慮します。 1. 製品機能とビジネスニーズのマッチング:製品機能の多さや柔軟性の高さが必ずしも優れているとは限りません。顧客による設定を必要とする機能が多すぎると、かえって使いやすさが低下する可能性があります。 2. AIモデルのパフォーマンス:パフォーマンスは複数の側面に反映されます。お客様は、自社の人材とビジネス戦略に基づき、モデルの精度、カバレッジ、応答時間、コンピューティングパワー消費量に関してトレードオフを行うことになります。 3. 業界知識が事前に構築されていますか?業界の中小規模の顧客は、メーカーに業界経験があり、いくつかのモデル、スクリプト、テンプレートが事前に構築されていることを望む場合があります。 4. 安定性、信頼性、有効性、セキュリティなどのシステムの標準要件。 中関村科学技術金融の2023年の技術レイアウト 2023年を見据え、中関村科技金融は会話型AIに関してどのような技術計画を立てるのでしょうか?張傑氏は、研究開発の重点は、事前学習済み対話言語モデル、会話分析、音声フローマイニングの3つに絞られると述べました。同時に、AI技術のエンジニアリングと製品化にも注力していく予定です。 1. 事前学習済み対話言語モデル:大規模言語モデルは、思考連鎖などの強力な機能を発揮してきました。これらの機能は、100億パラメータ未満の小規模モデルではなく、大規模モデルにのみ存在する可能性があります。近い将来、さらに大規模なパラメータスケールを持つマルチモーダル言語モデルが、複雑な推論能力の飛躍的な向上をもたらす可能性があります。技術レベルでの量的な変化は、アプリケーション層での質的な変化を引き起こす可能性があります。張潔氏のチームは今年、これらの機能が何を提供し、エンタープライズサービスシナリオにどのような変化をもたらすかを綿密に研究します。特に、大規模モデルに低コストでドメイン知識を注入することで、制御可能なドメイン知識に基づく質問応答および推論能力を付与できるようにする方法を検討します。 2. 会話分析:ドメイン知識は事実知識に焦点を当て、会話分析は行動意図に焦点を当てます。中関村科技金融は、実データに基づく統計分析手法を継続的に活用し、対話における共通の行動パターンを明らかにし、ターン設計に役立てていきます。ChatGPTは将来、コンテンツマーケティング、記事執筆、描画生成において大きな商業的価値を生み出す可能性がありますが、コーパスに基づく言語モデルと条件付き確率に基づいています。そのため、制御不能な生成テキストや、解釈不能なターン間の遷移が生じる可能性があり、これはしばしば「深刻なナンセンス」と呼ばれます。エンタープライズサービスシナリオにおける対話タスクが直面する問題は異なります。コーパスから条件付き確率を学習する問題ではなく、上位の低確率に対するベストプラクティスを見つける問題です。 3. スクリプトプロセスマイニング:スクリプトプロセスマイニングの分野では、海外のスタートアップ企業がRPAと生産プロセスや承認プロセスの最適化を組み合わせ、優れた実装成果を挙げ、大きな成功を収めています。しかし、中国ではまだ初期段階にあります。中関村科技金融研究所が研究しているスクリプトプロセスマイニングは、このアプローチとは異なります。主に対話データを処理し、対話シーケンスをイベントに分割し、イベントシーケンスからスクリプトプロセスのベストプラクティスを発見したり、プロセス整合性チェックを実行したりします。 AIエンジニアリングに関して、張傑氏は、AI技術は十分な知能を備えているだけでなく、下流システムやビジネス担当者にとって使いやすいほどシンプルである必要があると指摘しました。そうでなければ、AI技術の価値を実現することは困難です。中関村科技金融は、AIエンジニアリングへの投資を以下の3つの側面に重点的に行います。 1. ゼロコード:アルゴリズムを理解していないものの、プロジェクトデリバリー担当者や運用保守担当者など、ある程度のITのバックグラウンドを持つ人向けに設計されています。簡単なトレーニングを受けるだけで、特定のコーパスに基づいてモデルをカスタマイズできます。 2. 自己更新: モデルはオンライン環境でデータを継続的に蓄積し、オンライン データ内の機能の転送に適応するために継続的に更新できます。 3. 実感可能:AI技術がもたらす増分価値は、顧客が直感的に実感できるものでなければなりません。まず、AI技術の導入前後を比較可能にするために、厳格な手法と明確なビジネス目標を設定する必要があります。次に、AI技術の効果は必ずしも即時的または永続的ではないため、プロセスは「クローズドループ」である必要があります。ビジネス成果を製品にフィードバックし、好循環を形成するためには、継続的な反復が必要です。 つまり、AIエンジニアリングの目的は、ビジネスシナリオにおける反復作業の削減だけでなく、モデルの開発と保守にかかるコストの削減にもつながります。AIツールがシンプルであればあるほど、その応用範囲は広がります。 |