HUOXIU

業界の最前線:すべてのインターネット専門家が理解すべき「データインテリジェンス」

モバイルインターネット時代の自然な産物であるデータインテリジェンスは、今後の開発においても長期にわたり中心的な焦点であり続けるでしょう。この記事では、主にデータインテリジェンスの本質とその技術的要件について説明します。

1956年のダートマス会議で「人工知能」の概念が初めて提唱されて以来、現在のような技術革命と産業構造転換の新たな局面において、ビッグデータ、クラウドコンピューティング、そして5Gは広く知られるようになりました。ビッグデータ時代はもはや止められない勢いで、特に垂直・細分化された産業におけるビッグデータの応用は、巨大な潜在力を示しています。ビッグデータと様々な産業のビジネスシーンとの有機的な融合は、細分化された産業のデジタルトランスフォーメーションと高度化を牽引し、社会ガバナンスの革新的発展に貢献し、数多くの新しいビジネスモデルと新しいビジネス形態を生み出しています。

中国のモバイルインターネットの発展は、中国のビッグデータ産業の急速な発展を目の当たりにしてきました。モバイルインターネット時代の自然な産物であるデータインテリジェンスは、今後も長きにわたり、その発展の中核を担っていくでしょう。

本稿では、Getuiのデータインテリジェンス分野における長年の経験に基づき、データインテリジェンスの本質と技術的要件を解説します。また、データプラットフォーム、データシステム構築の性質、アプローチ、手法についても解説します。分かりやすい言葉遣いで、技術担当者、製品担当者、運用担当者の皆様にデータインテリジェンスと関連する技術システムを明確に理解していただき、日々の業務に新たな知見を提供できれば幸いです。

データ インテリジェンスとは何ですか? また、この概念はどこから来たのでしょうか?

2010年頃、モバイルインターネットの普及に伴い、ビッグデータという言葉が様々なメディアや業界フォーラムで話題になり始めたのを覚えています。人々が集まると、「皆さんはビッグデータに取り組んでいますか?」とよく聞かれました。実際、ほとんどの人はビッグデータの扱い方を知らなかったんです(笑)。

ビッグデータで何ができるのかということに関して、私は2013年頃に非常に説得力のある図を見つけました。

私はこれをビッグデータ成熟モデルと呼んでいます。本質的には、このプロセスはデータがツールから資産へ、補助的な要素から生産手段へと変化する過程であると理解しています。現在、多くの人がデジタル経済を理論的に定義し、実体経済と概念的に区別しようとしています。私の提案は、データが主要な生産手段として機能するのか、それとも中核的な資産として機能するのかという観点から定義することです。そうすれば、よりシンプルで明確になります。

近年の実際の発展から判断すると、ビッグデータは基本的に上図に示すモデルに沿って進化・発展してきました。

2013年頃、企業はデータの価値を認識し始めました。通信事業者、政府、公安、金融など、ビッグデータを生み出す環境を持つ様々な業界が、業務で発生するデータを収集・蓄積するためのビッグデータプラットフォームの構築を開始しました。同時に、金融などの業界は、外部データから迅速に価値を引き出し、自社のデータ不足を補おうと、大量の外部データを購入するようになりました。これにより、データ集約や関連サービスに携わる多くの企業が発展の機会を得ました。

2015年、ビッグデータはモニタリング段階に入り、データダッシュボードなどの手法を用いて業務オペレーションをモニタリングするようになりました。これはビッグデータの最も初期かつ成熟した応用例です。政府、中央企業、大規模国有企業にとって、データダッシュボードとリーダーシップダッシュボードはビッグデータの価値を最も直接的に反映する手段です。

2017年には、ビッグデータプラットフォームの構築がほぼ完了しました。単純なデータ表示では、もはや企業の多様なニーズを満たすことができなくなりました。ビッグデータはビジネスシナリオと融合し始め、ビッグデータに基づいてビジネス上の課題に対する洞察が得られるようになり、活況を呈しています。これらのアプリケーションは、金融分野では精密マーケティング、リスク管理・不正防止、公安分野では犯罪捜査、産業分野では障害予測・早期警報などに活用されています。

企業にとって、単純な数理統計だけではもはやビジネスシナリオへの洞察を得るのに十分ではありません。そのため、データマイニングやデータモデリング技術が登場しました。AIモデリングプラットフォームやデータサイエンスプラットフォームが注目を集め、モデリングプラットフォームに特化したスタートアップ企業も登場しています。しかし、AIモデリングプラットフォームを自社の技術として内製化し、これらのプラットフォームを基盤としたソリューションを開発することで、大企業のビッグデータアプリケーション導入を支援している企業はますます増えています。

2019年頃から、ビッグデータはビジネスの意思決定段階に入り始めました。これは、機械がデータレポートを生成し、それに基づいて意思決定を行うのではなく、機械が直接意思決定の提案を行い、推論を行うようになったことを意味します。例えば、フードデリバリーや配車サービスでは、美団(Meituan)や滴滴出行(Didi)のシステムが最適な配車方法を直接決定し、意思決定プロセスを自動的に完了し、乗客とドライバーにタスクを割り当てています。このようなシナリオは、消費者向けインターネットでは比較的一般的ですが、今後は産業向けインターネットや企業のビジネスシナリオにも徐々に浸透していくでしょう。つまり、ビッグデータはビジネスのデジタル化段階からデータインテリジェンス段階へと移行し始めているのです。

前節で述べたビッグデータの発展の歴史から、データインテリジェンスは現在、意思決定、最適化、そしてビジネス再構築の段階に対応していることがわかります。つまり、機械に推論能力を持たせるということです。そして、これらの能力は、自然言語処理(NLP)やナレッジグラフといった認知技術が徐々に成熟しつつあることを意味します。これが、NLPとナレッジグラフが2018年に市場で話題となった理由です。

したがって、データ主導の意思決定とデータ主導のビジネス開発に対する企業の新たな需要は、必然的に多くのデータ インテリジェンス企業の台頭につながるでしょう。

将来、テクノロジーが成熟するにつれ、ビッグデータは意思決定から最終段階、つまりビジネスの再構築へと移行するでしょう。多くの実行ステップは自動化できるものの、人間の関与は依然として不可欠です。そのため、人間と機械の協働は急速に発展し、人工知能(AI)から知能拡張(IA)へと進化していくでしょう。

この時点で、データ インテリジェンスを定義しようとします。

データ インテリジェンスは、データを生産手段として使用し、大規模データ処理、データ マイニング、機械学習、人間とコンピュータのインタラクション、視覚化などのさまざまなテクノロジを組み合わせて、大量のデータから知識を抽出、発見、獲得し、人々が意思決定を行うための効果的なデータ インテリジェンス サポートを提供し、不確実性を軽減または排除します。

データ インテリジェンスにはデータの提供が必要であり、データは中核資産および生産手段としての役割を果たすため、データ ガバナンスが特に重要になります。

データガバナンスとは何ですか?

「コーポレートガバナンス」という言葉をよく耳にしますが、経済学では主に次のようないくつかの問題を扱います。

  • 所有権と管理権はどのように分離すべきでしょうか?
  • 会社のオーナーはどのようにして科学的に権限を委譲し、プロのマネージャーを監督できるのでしょうか?

同様に、データ ガバナンスでも、次のようないくつかの同様の問題に対処する必要があります。

  • データ (資産) の例にはどのようなものがありますか?
  • データの所有権と使用権をどのように分離できますか?
  • データ資産所有者はどのようにしてデータユーザーを科学的に承認および監督できるでしょうか?

データ インテリジェンスのすべての方法は、実際には上記の問題を解決することを目的としています。

データ ガバナンスについては、後の記事で詳しく説明します。

同時に、貧富の差は富に対する考え方にあることも分かっています。富裕層は富を資産価値の増加という観点から捉え、いかにして資産を増やし、継続的に価値を高めていくかを考える傾向があります。一方、貧乏な人は富を消費という観点から捉え、収入の多くを消費に回す傾向があります。

データインテリジェンスの時代において、「豊か」になるためには、データの役割をどのように拡大し、どのようにパートナーを見つけて共同で価値を創造していくかを考える必要があります。しかし、データは他の資産とは異なり、複製可能であり、所有権の確立が難しいという特性があります。そのため、データセキュリティの問題を解決する必要があり、現在、業界が大きな懸念を抱いているセキュアコンピューティング技術が求められています。

もう一つ注意すべき点は、ビッグデータの4V、特にその膨大な量と多様な種類により、その集計方法やその結果に疑問が生じる場合があるということです。常識や直感で判断できるものもありますが、言葉では言い表せない品質が必ず存在します。そのため、データの生成から開始までの各段階において、完全な検証プロセスを可能にする品質保証システムが必要となります。

要約すると、データ インテリジェンス テクノロジー システムには、少なくとも次の 3 つの側面が含まれている必要があります。

  • データガバナンスシステム
  • データ品質保証システム
  • データセキュリティコンピューティングシステム

データ インテリジェンスは、ビッグ データ時代の重要かつ刺激的な段階として、機会と課題の両方をもたらします。

本稿は本シリーズの入門編として、このトピックの全体像を概観するものです。詳細は後続の記事で解説していきますので、皆様のお役に立てれば幸いです。



http://www.woshipm.com/ai/3702180.html