ビッグデータダイジェスト
著者: 袁俊峰
パンデミックの間、様々なプラットフォームにおけるオンラインライブストリーミングECの売上は大幅に増加しました。調査会社iiMedia Researchが発表したデータによると、中国のライブストリーミングEC産業の総額は2019年に4,338億元に達し、2020年には中国のオンラインライブストリーミングユーザー数は5億2,400万人に達し、市場規模は9,000億元を超えると予測されています。本稿では、ライブストリーミングECと比較したレコメンデーションモデルの欠点について考察します。
これは比較なので、ライブストリーミングeコマース内の特定のモデル、つまりトラフィックと知識主導の販売に焦点を当てます。これには、コンテンツのシーディング+ eコマースの収益化が含まれます。コンテンツのシーディングは、小紅書、抖音、快手などのプラットフォームやその他のセルフメディアを通じて行われ、販売はTmallと淘宝網に集中します。淘宝網のトップライブストリーマーである李佳奇は、以前はロレアルのビューティーアドバイザー兼ブロガーでした。彼のプロ意識は疑う余地がなく、数千もの口紅の中からたった3秒で1つの色を識別することができます。彼の良いイメージと性格、つまり毒舌、軽蔑的な表情、呆れたように目を回す態度は、ブランドへの忠誠心を示し、ブランドの神話を払拭することで信頼を築きます。羅勇昊は言うまでもなく、彼のイメージを使ってSmartisanのスマートフォンを宣伝し、ファンは製品発表会のチケットを購入しました。彼がライブストリーミングECに移行した際、既存のSmartisanファンはDouyinへと移り、初回放送で1億1000万元を超える売上高と4800万人以上の視聴者数という記録を達成しました。これは、ファンが依然として羅氏のプロフェッショナルな能力を信頼し、彼が宣伝する商品のコストパフォーマンスに優れていると信じているからです。
信頼は選択コストを削減する前提条件であり、これは有名ブランドを購入する理由でもあります。人生には、親、教師、友人、専門アドバイザー、そして様々なソーシャルメディアプラットフォームからの推薦やアドバイスが尽きることはありません。しかし、ほとんどのアドバイスは無駄で中身がありません。与える側と受け取る側の間には、親族関係、友情、その他の感情、専門知識など、何らかの支点が必要です。
ライブストリーマーの評判と信頼は築き上げる必要があります。顧客に価値を提供することによってのみ、長期的に収益を上げることができます。論理的には、eコマースや動画プラットフォーム上の推奨モデルにも同じことが当てはまるはずです。しかし実際には、推奨モデルの評価指標は非常に短期的であり、リアルタイムでさえあります。インターネット企業では、モデルのリリース決定にはA/Bテストが含まれます。大手インターネット企業は、さまざまな機能のA/Bテストを迅速に展開できるように、包括的なA/Bテストフレームワークを備えており、実際の顧客のフィードバックに基づいて機能を継続的に反復して改善しています。A/Bテストは本質的に別グループの実験であり、モデルのパフォーマンスを継続的に最適化するために、顧客からのフィードバックと新しい情報を継続的に収集します。さまざまな推奨モデルの最終的な評価と、それらをリリースするかどうかの決定は、一連のモデル指標によって決定されます。
ここではまず、レコメンデーションモデルの評価指標の概念をいくつか紹介する必要があります。レコメンデーションモデルにとって最も重要な評価指標は、通常、適合率と再現率を含む精度指標です。
- 精度:推奨リスト全体のうち、ユーザーが気に入った推奨リスト内のアイテムの割合。
- リコール率:ユーザーが気に入ったアイテムの総リストのうち、おすすめリストでユーザーが気に入ったアイテムの割合。
ユーザー満足度:ユーザー フィードバックの満足度。クリックスルー率やコンバージョン率などの指標で測定できます。
カバレッジ:アイテムとユーザーのリスト全体が公平にカバーされているかどうか。
多様性:推奨リストでカバーされるさまざまな側面にわたるユーザーの興味の割合。
新規性:アルゴリズムは、ユーザーが興味を持つ可能性はあるものの、めったに遭遇しないアイテムを推奨します。
説明:推奨理由。
堅牢性:推奨システムの攻撃防止機能と不正行為防止機能を指します。
これらのモデル評価基準はすべて顧客の関心と一致しているように見えます。しかし、モデルを導入するかどうかの最終決定は、レコメンデーションシステムのビジネス目標によって決まります。eコマースのレコメンデーションシステムの場合、最終的なビジネス目標は通常、プラットフォームの取引量です。音楽、映画、ニュース、ショートビデオプラットフォームのレコメンデーションシステムの場合、最終的なビジネス目標はユーザーのクリック数とプラットフォームの視聴時間です。ビッグデータの大部分は、インターネット・プラットフォームから得られるユーザー行動データで構成されています。このデータ基盤こそが、レコメンデーション・モデルの構築を可能にします。レコメンデーション・モデルの背後にある原理は理にかなっています。ユーザーの嗜好やその他の関連特性に基づいてレコメンデーションを行うことで、ユーザーの検索コストを効果的に削減します。レコメンデーション・モデルの評価基準は、ユーザーの関心事とほぼ一致しています。しかし、レコメンデーション・モデルをオンラインに展開するかどうかの評価基準は、最終的にはプラットフォーム自身のビジネス目標に基づいて決定されます。モデルの最終的な目標は各インターネット・プラットフォームの商業的目標の達成であるにもかかわらず、ユーザーデータを利用するという点では、「恩知らず」という印象を与えてしまうのは避けられません。もちろん、ユーザー満足度、カバレッジ、多様性、公平性などの指標を向上させつつ、プラットフォームの様々なビジネス指標も向上させるのが理想的です。しかし、この二つの目標を同時に達成できない場合、最終的なオンライン・モデルは必ずしもユーザーの利益を優先するものにはならないことがよくあります。もちろん、ビジネスの観点からは、これは当然のことです。重要なのは、モデルの目標としてのクリックスルー率とコンバージョン率は、最も可能性の高いユーザー行動を予測することしかできず、ユーザーはより合理的な決定を下す必要があるということです。 ノーベル経済学賞受賞者のポール・サミュエルソンは、消費者の行動が効用最大化を目的としている場合、消費者が市場で購入できる商品の組み合わせが最適な組み合わせであるという「弱い顕示選好公理」を提唱しました。これらの実際に購入された組み合わせは、消費者が購入できるものの実際には購入しない組み合わせよりも優れています。言い換えれば、組み合わせAが組み合わせBよりも消費者に好まれることを直接示し、AとBが異なる場合、Bが消費者にAよりも好まれることを直接示すことは不可能です。弱い顕示選好公理は、現代の新古典派経済学の礎石の一つです。観察可能な行動を通じて、隠れた選好を含むエージェントの選好を明らかにします。他の観察不可能な経済的効用理論と比較して、より実用的です。観察可能性と定量化可能性は、データモデリングの基礎でもあります。推奨モデルやランキングモデルはユーザーの選好に基づいており、これも上記の経済原則と高い整合性を持っています。例えば、協調フィルタリングに基づくレコメンデーションモデルは、ユーザーが好む商品やコンテンツを分析します。ユーザーAとBが非常に似ていることが判明した場合、両者は似たような嗜好を持っている、つまり似たものを好むと仮定します。ユーザーBが、ユーザーAが購入または閲覧していない商品やコンテンツを好んでいる場合、その商品やコンテンツがユーザーAに推奨されます。これがユーザーベース協調フィルタリング(CF)の原理です。このモデルの根底にある仮定は、明示的選好公理と一致していることがわかります。しかし、神経科学は、選好間の関係が不安定であることを発見しました。被験者が知覚判断を行う際、ランダムな認知プロセスを経て、ランダムな選好決定を下します。ポール・グラムジー教授は、いくつかの神経科学実験を分析・設計しました。その一つは、サルの脳領域のニューロンの発火率と与えられた対象物との関係をモニタリングすることにより、サルが報酬関連の選好を示す確率を推定するというものでした。この神経科学実験の詳細な説明はここでは省略します。この実験の結論は、サルの選好決定は、複数の選択肢の間に閾値を設定する神経回路を活性化することで達成されるというものです。これは「勝者総取り」の仕組みに似ています。「神経生物学者による神経系研究は、すべての信号(期待値の主観的価値もまた神経信号である)がランダムであることを示唆しています。」[1]したがって、選好はランダムである。新古典派経済学の顕示選好公理における固定された選好順序の仮定には欠陥があり、この仮定に基づく期待効用理論による合理的意思決定は無効である。選好は状況依存的、プロセス依存的、さらには潜在的に可逆的であると考えるべきである。様々な誘因が選好要因の相対的な重みを変え、異なる選好順序をもたらす可能性がある。言い換えれば、選好は誘因を通じて確立される。これが広告、推薦モデル、ライブストリーミングeコマースの価値である。 「経済学者は通常、人々が自分が何を望んでいるかを知っていると想定するが、広告主は人々が知らないと想定するのか?」近年の理論の発展に伴い、経済学における合理的行為者の仮定と行為者が自分の選好を知っているという仮定は、徐々に限定合理性の仮定に取って代わられてきた。クリックスルー率(CTR)やコンバージョン率といったレコメンデーションモデルの基本的な前提と最適化指標は、顕示選好公理の原則と一致しています。言い換えれば、人々の効用選好はランダムであるため、CTRやコンバージョン率に基づくレコメンデーションモデルの最適化目標は、必ずしも実際のユーザーの最適な効用と一致するとは限りません。しかし、ライブストリーミングeコマースはファンの嗜好を導きます。長期的な信頼関係を築くためには、ホストはユーザーがより良く、より合理的な選択を行えるように支援する必要があります。したがって、ライブストリーミング電子商取引と比較すると、推奨モデルには次の欠点があります。信頼の基盤の欠如と専門性の不十分な実証、そして推奨モデルの解釈可能性は、業界における改善の重要な領域です。
モデルの評価指標は短期的な傾向があり、ユーザーの有用性を完全に反映することはできません。
最終的には、このモデルの導入はアプリとプラットフォームの商業的利益に依存します。
このモデルの目的は、より合理的な選択肢を提案することではなく、ユーザーが将来行う可能性が最も高い選択肢を予測することです。
Apple創業者のスティーブ・ジョブズは、Siriの位置づけについて尋ねられた際、「Siriは検索会社ではなく、人工知能会社だ」と答えました。ジョブズにとってSiriは世界に革命をもたらす先駆的なインテリジェント製品として位置付けられていたことが伺えます。また、これは将来の情報処理が検索と推奨からインテリジェントアシスタントへと進化することを予見していました。様々な分野におけるインテリジェントアシスタントに関するより詳細な議論については、近日刊行予定の書籍『人工知能は金融投資に何をもたらしたのか?』[2]をご覧ください。