データ操作事例: 情報フローが製品の最適化につながる
情報フィードは、私たちの 24 時間のインターネット生活の中で、ほぼどこにでもあるものになりました。地下鉄で通勤しているときに、Toutiao をチェックして最新のニュースを入手することができます。情報フローでは、注目の記事をキューにきちんと並べて読みやすくしています。おいしい食事をしたいときは、Dianpingの情報フローが市内の多くのレストランを推奨しています。夜眠れず、一日の疲れを癒すために何かを買いたいとき、Taobao のおすすめ商品の素晴らしい品揃えは、閲覧をやめられないほど正確です... 情報フロー形式は広く使用されていますが、最も初期の応用は、2006 年に Facebook がリリースしたニュース フィード機能から始まった情報コンテンツのシナリオでした。 このプラットフォームは、確立されたアルゴリズムとルールに従ってコンテンツを分類した後に集約し、ユーザーが 1 つのページでスムーズかつ効率的にコンテンツを消費できるようにします。ユーザーは、モバイル インタラクティブ ネットワークの先史時代のように、ポータルとブログ サイト間を頻繁に行き来する必要がなくなりました。また、プラットフォームは、集約されたコンテンツ表示プラットフォームを提供することで、ユーザーを自らの管轄区域内に効率的に留めておくこともできます。 情報の流れを表す英語は「Feed」ですが、これは実に巧妙な言葉です。 Feed は英語で「飼料」を意味し、情報フローのシナリオにおいて、プラットフォームがユーザーに一定の順序でコンテンツを「供給」する場面を鮮やかに表現しています。 ユーザーがコンテンツを消費できる時間は限られています。プラットフォームは、限られた時間内にユーザーにお気に入りのコンテンツを提供して、ユーザーがプラットフォーム上でより多くのコンテンツを消費できるようにするにはどうすればよいでしょうか (それによってプラットフォームに高い潜在的な商業的価値をもたらすには)?これは、すべてのフィードシーン運営者が長年研究してきた「推奨ランキング」の問題です。 レコメンデーションエンジンの核となるのは「適切なアイテムを適切なユーザーにいかに推奨するか」であり、そのため「アイテム」と「ユーザー」のつながりを確立することがレコメンデーションアルゴリズムにおける最も核心的な命題となります。推奨プロセス全体は、基本的に「リコール」→「ソート」→「重みの調整」→「結果の出力」というプロセスとして要約できます。誰もがプロセスを理解できるように、簡単な比喩が使用されます。 誰もが学生時代に軍事訓練に参加したことがあるはずです。トレーニングの最後に行われる最終パレードレビューは、トレーニングプロセス全体のハイライトとなります。では、キューを合理的に配置するにはどうすればよいでしょうか?
推奨アルゴリズムは非常に奥が深く技術的なテーマですが、この本は主にオペレーターを対象としているため、著者は情報フローのランキングに影響を与える主な要因をより明確なレベルからまとめようとしています。
そうは言っても、私はこれまでツール製品を操作してきた経験を皆さんと共有したいと思います。ほとんどのツール製品が抱えるジレンマは誰もがよく知っていることでしょう。つまり、ユーザーが長期間利用し続け、定着率が低いため、効率と収益化の方法が限られてしまうのです。市場には競合製品が数多く存在します。データ指標を通じて製品の価値を迅速に証明できない場合、製品全体がキャンセルされるリスクに直面することになります。 そのため、ユーザーがサイトで過ごす時間をいかに増やすかが、私たちのチームにとって非常に重要な課題となっています。当社のツール製品にはWiFi接続機能があります。以前は、ユーザーが WiFi に正常に接続すると、リダイレクトされるランディング ページは「接続成功」ページでした。それ以外には何のつながりもありませんでした。 ただし、この時点では、ユーザーは操作を完了して感情が最高潮に達しており、トラフィックの影響を受けにくい WiFi シナリオにいます。情報フィードの内容を引き継ぐことで、ユーザーにコンテンツ消費の価値を提供し、同時に商業的な収益化シナリオも作成できるのではないかと考えました。 しかし、私たちはツールプロダクトチームであり、コンテンツ運用の経験はありません。 0から1までの情報フィードを作成するにはどうすればよいでしょうか?チームの現状を分析した後、私たちはすぐに次の側面から始めることにしました。まず、情報コンテンツはどこから来ているのでしょうか?当社の姉妹製品の中には、情報コンテンツが既成のものもあるが、具体的な推奨アルゴリズムは当社自身で開発する必要がある。当社のアルゴリズム チームにはコンテンツの推奨に関する経験はありませんが、ソフトウェア配信の推奨に関する経験には、学習して再利用できる類似点もあります。 料理が上手な人は米なしでは料理ができません。 「ご飯」も「炊き込みご飯」も両方ありますが、ユーザーが一番美味しいと思うのは「チャーハン」なのか「スープライス」なのかは、もっと試してみないと結論が出ません。 推奨ソートにはさまざまな要素がありますが、ツール製品の属性により、使用できる要素は多くありません。状況に応じて、次の 3 つのグループの A/B テスト実験を実施することにしました。
3つの実験グループの設定に基づいて、戦略を実行するための3つのランダムテストユーザーグループを選択し、「平均情報消費時間」を主要な評価指標として設定しました。実験結果が出るまで3日間も待ちました。この 3 日間、私たちのチームはどの戦略が最も効果的かを賭けていました。読者の皆さん、どの戦略が最も効果的だと思いますか? チーム内の賭けは基本的にすべて、最初の 2 つのグループの戦略の方が優れているという見方に集中していました。ユーザー ポートレートの方が良いと考える同僚の見解は単純明快です。ユーザーは、自分にとってより関連性の高いコンテンツに、より興味を持つようになります。人気順の並べ替えのほうが効果があると考える同僚も正しいです。より多くの人がクリックするコンテンツは、興味深く新鮮なものであることが多く、自然とより多くの人が読みたくなるものになります。 しかし、当社の運用スタッフが実験データを収集して分類した後、彼らは少し驚きました。時間による分類に基づいた最も人気のないオプション 3 が、実際には最初の 2 つのオプションよりも「平均情報消費時間」が優れていたのです。チームはしばらくの間、少し意気消沈し、アルゴリズムチームの同僚の技術力にも疑問を抱いていました。 オペレーターとして、この時点でデータ分析をさらに一歩進めて、データ指標が真実全体を示しているかどうかを確認する必要があります。 この問題を分析するために、まず問題を細分化しました。 実験データ指標:
実験設計:
分解して分析した結果、最初の 2 つのソリューション グループの貧弱なデータ指標が必ずしも真実のすべてではないことがわかりました。まず、「平均情報消費時間」という指標の設定に問題があることがわかりました。結局のところ、私たちの製品はツール製品であり、ほとんどのユーザーは WiFi に接続した後、離れてしまいます。情報フィードは、比較的活動していない一部のユーザーのみを対象とした機能です。 そのため、実験グループ間のユーザーの「平均情報消費時間」は非常に離散的であり、プラン 3 の個々の極端なユーザーの存在が全体の平均時間データを引き上げています。この問題を解決するために、計算中に極端な値に対して一定の処理を行い、「平均情報クリック率」というデータ指標を追加することで、さまざまなソリューションの効果をより客観的に評価することができます。 第二に、分析の結果、データ収集上の理由により、計画 1 と計画 2 はそれぞれの戦略の効果を十分に達成できなかったことが判明しました。たとえば、ソリューション 1「ユーザー ポートレートに基づく並べ替え」では、Android の権限制限により、実験グループの多くのユーザーのインストール リスト データが不完全でした。一部のユーザーの IP の地理的位置の識別が十分に正確ではありませんでした。テストの結果、広州の一部のユーザーに北京のローカルニュースが推奨され、当然ながら戦略の有効性に影響を与えていることが判明した。 たとえば、プラン 2 では、一部の「クリックベイト」コンテンツはクリック率が高いため、実験ユーザー グループの最初の画面は「クリックベイト」コンテンツでいっぱいになります。コンテンツの品質が非常に低く、ユーザーはクリック後すぐに画面から飛び出してしまうため、戦略の実験結果は悪くなります。 データ指標をさらに分析せずに実験結果だけを見ると、「時間ソート」がユーザーにとって最適なソリューションであり、将来的にこの方向に開発を進めていくべきだとすぐに考えてしまうかもしれません。モデルアルゴリズムのいわゆる最適化は必要ありません。しかし、分析を通じてのみ、事実の全体像をより明確に把握し、反復のための最適化計画を継続的に提案することができます。 ここで反映されているのは、問題分解思考の重要性と、論理的な問題分析思考の重要性です。この本を通じて、読者の皆さんとこれらの思考フレームワークを共有し、より優れたオペレーターになれることを願っています。 今後は、データ操作、インターネット製品(または個人的な芸術的趣味)に関する記事をプラットフォーム上でさらに共有する予定です。誰でもコミュニケーションを歓迎します! この記事はもともと @黄一元 によって Everyone is a Product Manager に掲載されました。著者の許可なく複製することは禁止します。 タイトル画像は、CC0 プロトコルに基づいて Unsplash から取得したものです。 |
<<: データ プロダクト オペレーション マネージャー (ビッグ データ プロダクト マネージャーになるには? 試験の要件は何ですか? 難易度はどのくらいですか?)
自動車広告主による情報フロー配置のシェアが増加し、百度と今日頭条が広告主の第一選択肢となっている。情...
Senhu Catering丨レストランに顧客を「引き付ける」ためのレストラン広告の6つの実用的な...
顧客獲得コストはますます高くなっています。ユーザーの操作を理解するときが来ました。ユーザー操作の中心...
農業と商業の「二輪駆動」が湖のツアーを支えていますイベントによってもたらされる「交通量」を、いかにし...
オンラインとオフラインの顧客誘致と消費促進:「老舗ブランド」は対策の組み合わせで好調なスタート王府井...
WeChatファン爆発の秘密:外部トラフィック2番目の方法、つまりWeChatから外部トラフィック...
国内のウェブマスターが最もよく利用する海外サーバーはアメリカのサーバーです。ウェブマスターがサーバー...
お店にお客さんが足りない?これら 5 つの顧客誘致方法を使用すると、顧客が積極的に来店するようにな...
データオペレーションエンジニアの試験を受ける方法、応募条件、試験は難しいか、資格を取得するのにどのく...
アメリカのホスティングプロバイダーを利用するウェブマスターのほとんどは、基本的にウーコマースプラグイ...
第4四半期にはどのようにマーケティングすべきでしょうか?第4四半期にはどのようにマーケティングすべき...
ハンチントン病を中心とした希少疾患患者のケアハンティントン・ザ・ダンサー(HD)アンデルセン童話に出...
指標システムに基づくデータウェアハウス構築とデータ可視化序文データ作業における私の経験を共有する記事...
ECストア運営分析ポイント改善マインドマップ1. レバレッジ思考電子商取引の業務は、実は多くの些細...
KubeSphee は、Kubenetes 上に構築されたアプリケーション中心のマルチテナント コン...