HUOXIU

GPT-4 リリース: AI 主導の運用と保守はどのような変化をもたらすでしょうか?

OpenAIは3月14日、画像とテキストの両方の入力をサポートし、テキスト出力も提供する大規模マルチモーダルモデル「GPT-4」をリリースしました。以前のバージョンと比較して、GPT-4ではテキスト入力の制限が25,000文字に増加し、応答精度が大幅に向上しています。AIを活用した運用保守(O&M)の時代が到来しました。O&Mチームは変化と課題にどのように対応すべきでしょうか?


AIOps は運用と保守の方向性を示していますが、AIOps は単なる技術手段やプラットフォームとして捉えるのではなく、デジタル時代の人間と機械の協働による運用と保守のモデルとして捉えるべきです。

1. 人間と機械が協調するAIOps運用保守作業モード

新たな業務モデルの出現は、必然的にそれまで安定していた業務モデルを変革します。変化は通常、新たな課題をもたらすため、新たな業務モデルは、既存の運用・保守で直面する困難に対処する必要があります。金融業界における事業継続管理を例に挙げると、その目標は、企業のリスク予防能力の向上、計画外の事業中断の効果的な削減、そしてオペレーショナルリスクの防止です。従来、事業継続管理では、ツールを用いて未知の異常を定量的に分析し、迅速に特定することで、大規模な災害発生後に計画通りに事業継続を回復できるようにしてきました。
現在の複雑な技術アーキテクチャ、革新的な技術の継続的な導入、ソフトウェア バージョンの急速な反復、および深刻な情報セキュリティの脅威に直面して、従来は事後対応型、問題主導型、運用ベース、経験ベースであった従来の運用および保守チームは、企業のビジネス継続性を確保するという目標を容易に達成できなくなりました。
金融機関が安全かつ安定的に運営するためには、洞察を提供し、意思決定をサポートし、実行を追跡し、複雑な環境における運用管理能力を強化するための運用データが必要です。

  • 「何が起こったか?」の最新情報をリアルタイムで入手

  • 関連性分析:「なぜこのようなことが起きたのか?」

  • 「何が起こるか?」をインテリジェントに予測します。

  • 意思決定プロセスには、「どのような対策を講じるか」を決定することが含まれます。

  • プロセスを迅速に自動化するにはどうすればよいでしょうか?

  • 「作業遂行効率」をリアルタイムで監視?

AIOpsは、上記の問題を解決するために開発されました。従来の運用保守業務モデルと比較して、AIOpsは全く新しい運用保守業務モデルの構築に焦点を当てているのではなく、既存の「専門家の経験+実践プロセス+ツールプラットフォーム」という運用保守モデルを補完し、企業に「洞察力と認識力、運用上の意思決定、そして機械による実行」能力を提供し、「人間と機械の協働」モデルへの変革を支援することに重点を置いています。

なぜ「ヒューマンマシンコラボレーション」モデルではなく、インテリジェントモデルなのか?現在のAIOpsの応用例から判断すると、人工知能技術は進歩しているものの、複雑で変化に富み、不完全な情報環境、特に複雑な緊急対応が必要な状況においては、専門家の代替にはなり得ない。その応用範囲は、AIの弱点となる特定の領域に限定されている。「ヒューマンマシンコラボレーション」は、機械を用いて人間の意思決定と実行を支援することに重点を置いている。既存の運用保守(O&M)組織に加え、研究開発、試験、ベンダーなど、O&M以外の協働ネットワークにもロボットの役割を追加することで、ヒューマンマシンコラボレーションO&Mモデルを形成する。

人間と機械の協働による運用・保守モデルにおいて、最も重要な役割は依然として人間にあります。人間の創造性と、機械が提供するデータやアルゴリズムを組み合わせることで、人間による運用・保守タスクの遂行を支援します。 一般的に、人間と機械の協働には、人間とロボット双方の強みを活かし、相乗効果を生み出すソリューションを形成することが求められます。AIOpsの今後の開発は、以下の3つの主要分野に焦点を当てることができます。

  • 「データ + アルゴリズム」により、運用および保守の専門家は「リアルタイムの認識と意思決定の支援」が可能になります。
  • 運用・保守ロボットの配置を増やし、「ビッグコンピューティング」、「大規模データ分析」、「操作性」、「プロセス指向」、「ルーチン」、「24時間365日」、「ヒューマンマシンエクスペリエンス」などの分野で運用・保守業務を再構築します。
  • 意思決定と実行のクローズドループ実装を確実にするために、デジタル プラットフォーム ベースの管理モデルを確立します。

2. データ、アルゴリズム、シナリオ、知識は、AIOps の 4 つの主要要素を構成します。

ガートナーの定義によると、AIOpsアプリケーションはビッグデータ、最新の機械学習技術、その他の分析技術の活用を必要とするため、導入障壁が比較的高い作業モデルとなっています。AIOpsをより効果的に実装するには、運用組織はAIOpsの中核となる概念を深く理解し、データ駆動型、アルゴリズムサポート型、シナリオ指向型、知識拡張型の4つの主要要素に重点を置く必要があります。
データが最も重要です。AIOps には、高品質のデータを迅速に生成する機能が必要です。
「高速」アプローチは、「ミドルプラットフォーム」アプローチを用いて構築され、統一的なデータ収集・管理、リアルタイムおよびバッチデータ処理機能、運用・保守に適した運用・保守アルゴリズム、ストレージソリューション、マスターデータ、指標モデルなどを構築します。「高品質」アプローチは、散在するデータを統合し、オンライン化後に「ライブデータ」を形成し、データ品質を管理することを意味します。

技術的な観点から見ると、データフローは、 取得、保管、計算、管理、利用を含む、リアルタイムでライフサイクル全体のデータフロー管理を行う機能を備えています。データ取得とは、オンデマンドでオンラインでデータを収集する機能のことです。データ保管とは、データの種類とアプリケーションの特性に基づいてデータをアーカイブ、整理、転送、共有することです。データ計算には、データのラベル付け、クリーニング、モデリング、処理、標準化、品質監視、データ分析、およびデータ洞察、意思決定、実行のための統計が含まれます。データ管理は、運用データ標準、マスターデータ、メタデータ、データ品質、データセキュリティの管理を含むデータガバナンスに重点を置いています。データ利用は、データカタログ、サービスポータル、およびデータサービス機能のサポートを含むデータサービス機能に重点を置いています。

アルゴリズム ブレインは、特定のシナリオに合わせて運用および保守アルゴリズムを適応、導入し、アルゴリズム モデル システムを構築します。

機械学習、特にディープラーニングの大規模応用は、人工知能(AI)の急速な発展を牽引してきました。国内B2B市場の急成長に伴い、AIOpsにおけるAI研究と応用は爆発的な成長を遂げています。AI技術を組み込んだアルゴリズムには、3つの利点があります。第一に、高い運用安定性。AIは繰り返し発生する問題を分析する際に、休むことなく稼働し、環境要因の影響を受けません。第二に、運用リスクの低減。従来の人間の経験をAIに置き換えることで、運用リスクや倫理リスクをより適切に回避できます。第三に、意思決定効率の効果的な向上。AIはビッグデータを迅速にフィルタリング・分析し、人々の意思決定をより効率的に支援します。 金融企業として、人材不足と報酬体系の課題から、 アルゴリズム開発において外部ベンダーとの連携を強化する必要がある一方で、アルゴリズムの追求は必ずしも技術革新にとどまりません。実際、専門家の繰り返し経験の活用もアルゴリズム実装の一形態であり、多くの場合、より信頼性が高いと言えます。 現在主流のアルゴリズムについては、前のセクションで説明した一般的なアルゴリズムを参照してください。ここでは繰り返しません。

シナリオに基づいて、問題点から始めて期待を評価し、インテリジェンスを使用して運用および保守シナリオを強化し、インテリジェントな運用および保守機能を実装します。

AIOpsはその名の通り、「AI + Ops」を含み、AIを活用して運用シナリオを強化するモデルを表します。前述のデータ基盤とアルゴリズム脳を活用した次のステップは、シナリオ実装に重点を置いたAIOps運用モデルの実装です。1つのアプローチは、アルゴリズムを活用して既存の運用シナリオを強化することです。もう1つは、アルゴリズムを使用してこれまで不可能だった運用シナリオを実現することです。前者は迅速な結果をもたらすモデルであり、後者は変化への適応を伴います。

運用と保守の知識は、運用と保守の分野に関連するオブジェクトの定義、手法、トラブルシューティング/ソリューションの経験に関する大量の情報を説明します。

運用保守(O&M)ナレッジグラフは、O&Mオブジェクトに関する様々な情報を結び付けるリレーショナルネットワークであり、O&Mデータを表現するための重要な技術として機能します。O&Mナレッジグラフを構築することで、膨大なデータから様々なO&Mエンティティを自動的にマイニングし、その特性をプロファイルして構造的に記述し、エンティティ間の関係を動的に記録することができます。O&Mナレッジグラフに基づき、自然言語処理などのアルゴリズムを活用することで、IT担当者は障害連鎖の伝播分析、根本原因の特定、インテリジェントな変更影響分析、障害予測など、様々なAIOpsシナリオを実現できます。

3. AIOpsに関するその他の視点

シナリオ マップを確立し、AIOps を体系的かつリズミカルに実装します。

現在、多くの分野におけるAI技術の応用と同様に、AIはプラットフォーム機能であり、業務機能ではありません。オンラインバンキングシステムを例に挙げましょう。PCベースのオンラインバンキングは、窓口に行く際の利便性の問題を解決し、モバイルバンキングは、マウスとキーボード操作から指のスワイプやいつでも操作できる操作性へと移行するという操作性の問題を解決します。AIのビデオ認識および音声認識技術は、モバイルバンキングのユーザーエクスペリエンスをさらに向上させ、タッチスクリーンから没入型インテリジェンスへと進化させます。このプロセス全体を通して、多くの業務プロセスの本質は変わりません。したがって、AIOpsに取り組む際には、運用組織はシナリオマップを作成し、それに基づいてタスクの優先順位付けを行い、AIの利点を活用して運用シナリオの特定の側面を強化する方法を決定する必要があります。

「ライブデータ」はインテリジェントな運用と保守の基盤です。

「ライブデータ」には2つの意味があります。1つ目は、データが生きている、つまり完全にオンラインであるということです。2つ目は、データがアクティブに利用されている、つまり継続的に洗練され、アプリケーションを通じて新しいデータを生成し、データフィードバックを生み出すということです。これまで、運用データ分析は主にバッチオフラインデータに依存してレポートを作成し、意思決定をサポートしていました。しかし、多くの運用シナリオではリアルタイムのデータ分析が求められています。そのため、運用データプラットフォームを活用して、マシンデータのリアルタイム取得と制御、データ資産の実装、そしてデータ消費のコンテキスト化を実現し、データアプリケーション実行のためのフィードバックメカニズムを確立することで、データドリブンワークフローを継続的に最適化し、より正確なデータを生成することが必要です。

したがって、ライブデータを実現するには、3つの重要な要素があります。まず、運用・保守シナリオのための協働ネットワークを構築する必要があります。そのためには、オンラインワークフローのサイロを打破し、人、組織、ソフトウェア、ハードウェア間のネットワーク接続を確立する必要があります。次に、運用・保守組織は、関連する生産データと運用データを集約し、データサービスとして抽象化することで、運用・保守シナリオに便利な方法で価値を提供するための運用・保守データプラットフォームを構築する必要があります。最後に、継続的にデータを消費し、問題を発見し、データを修正し、データ付加価値サービスを探索し、新しいデータを生成する必要があります。

第一印象は重要です。

AIOpsは全く新しい動作モデルであるため、当初はユーザーに信頼性と使いやすさの印象を与えます。しかし、この最初の印象が懐疑的なものであれば、その後のこの動作モデルの運用と普及に大きな課題をもたらすでしょう。AIOpsアルゴリズムが解決すべき最も重要な課題は、「アルゴリズムの精度」に対する人々の認識を変えることです。言い換えれば、「アルゴリズム」の導入はイノベーションのためではなく、現実の問題を真に解決するためのものです。障害箇所特定支援を例に挙げると、正常に稼働している運用組織における多くの障害は、通常、専門家の経験、監視ツール、そして効果的なコラボレーションメカニズムによって対処できます。障害管理を強化するためにAIOpsを導入することで、スピードの向上と精度の向上という2つの目標を達成することを目指しています。機械の自動化と計算能力のおかげで、「 迅速な」問題は、適切に設計されたオンライン緊急シナリオを通じて予測通りに解決できます。しかし、「精度」にはややブラックボックス的な意味合いが伴います。したがって、アルゴリズムを適用する際には慎重なアプローチが必要です。問題を解決することは、アルゴリズム自体の洗練度よりもはるかに重要です。