業務におけるデータ分析の進め方(業務を導くコア分析手法:5段階分析法)

業務におけるデータ分析の進め方(業務を導くコア分析手法:5段階分析法)

業務を導くためのコア分析方法: 5段階分析法

多くの成長事例を見て、目の前の仕事とパフォーマンスの目標を検討した後でも、まだそれを達成する方法がわからないと感じますか?それは、多くのケースでは結論に至った分析プロセスは説明されておらず、問題の背景や目的、最適化後の効果のみが説明されているからです。実際の分析プロセスは、多くの場合、「発見」という言葉で簡単に説明されます。

もちろん、データ分析プロセスは主観的なプロセスであり、特に急速に変化するインターネット分野では、統一されたプロセスに従って分析全体を完了することは不可能であると主張する人もいるでしょう。では、データ分析プロセスは、散在する技術のみがあり従うべきルールがないプロセスなのでしょうか、それとも明確な手順があり厳密に従うことができるプロセスなのでしょうか?後者だと思います。

ここでは、一般的なデータ分析方法である 5 段階のデータ分析フレームワークを紹介します。このフレームワークには次の特性があります。

  1. 特定のビジネスに縛られることなく、意思決定に必要な情報に基づいています。
  2. オープンであり、個人の経験と最先端のテクノロジーを統合できること。
  3. ビッグデータ技術と組み合わせることで、手動リンクを排除し、自動化を実現できます。
  4. ロジックは明確で、簡単に学習できます。

このシンプルな 5 ステップのデータ分析方法は、基本的に、日常業務における一般的なデータ分析の問題の少なくとも 80% を処理できます。残りの 20% のシナリオは、この基本的な分析方法論に基づいて拡張できます。これについては、次のコンテンツで説明します。

まず、5 つの基本的な手順を確認しましょう。

  1. まとめ
  2. セグメンテーション
  3. 評価する
  4. 帰属
  5. 意思決定

1.1.1 要約

このステップでは、DNU、DAU、GMV、ROI などの一般的な指標に焦点を当てます。データ分析について話すときはいつでも、データ分析には「明確な目標」が必要であることを思い出すでしょう。したがって、その重要性について詳しく説明する必要はありません。

もちろん、目標はすべての指標の中で最も重要です。しかし、目標だけでは不十分であり、他の補助指標も必要です。たとえば、ROI は入力と出力を組み合わせて計算されます。 GMV は、ユーザー数にユーザーあたりの平均 GMV を掛けて計算することもできます。このようにして、目標の計算をより関連性の高い指標の組み合わせに分割します。さらに、これらの指標はより基本的なものであり、何らかの操作手段を通じてこれらの指標の変化する傾向に影響を与えることができます。

この部分は理解するのが難しくありません。ただし、指標間の計算関係を調べ、徐々に注目すべき指標をすべて見つけ出す必要があります。今日のインターネット製品の運用では、注目すべき指標が不足することはなく、目が回ってしまうほど多くあります。しかし、私たちが気にする必要があるのは、目標に関係のある指標だけです。

1.1.2 セグメンテーション

この手順は、インジケーターに 1 つ以上のディメンションを追加することと同じです。最も単純な次元はおそらく時間です。たとえば、私たちは日々変化する紫外線の傾向を観察しています。あるいは、さまざまなページによってもたらされた GMV、さまざまなユーザー グループの GMV などを確認します。前のインジケーターが単なる数字であることを理解すると、ディメンションを追加するとデータの列になります。 2 つの次元を追加するとテーブルになります。

インジケーターの現在の状態と同様に、インジケーターを分割するために使用できる多くのディメンションを簡単に見つけることができます。例えば、上で述べた日付や混雑状況、新規ユーザーを引き付けるためのソース チャネル、アクティブ トラフィックやコンバージョン パスのソースなどです。これらのディメンションを配置して組み合わせると、追跡できないほど多数の複雑な分割ディメンションが生成されます。

したがって、セグメンテーションの前の重要なステップは、ディメンションの重要性を区別することです。

どうやって区別するのでしょうか?

これらの分割ディメンションは、実行可能かどうかに基づいて優先順位を付ける必要があります。たとえば、先ほど、アプリ内のさまざまなページを閲覧することでもたらされる GMV について説明しました。しかし、GMV の高いページに多くのトラフィックを割り当てるために必要な技術的手段や運用ツールがなく、GMV の低いページのトラフィックを削減できない場合、このページ分割方法では、操作後の最適化スペースはおろか、操作の余地も残されません。

このような場合は、ソース ページ ディメンションをキー ディメンションではなく、単に「あれば便利な」ディメンションとして考慮する必要があります。

もう 1 つの例は、ユーザーのセグメンテーションです。特に、成長を促進するために外部投資からより多くの高品質の新規ユーザーを引き付けたいと考えている場合に役立ちます。現時点では、まず既存の高品質ユーザーのユーザー プロファイルを作成し、高品質ユーザーを識別できるいくつかの機能を決定し、その後、ローンチ時にこれらの機能を使用して高品質ユーザーを引き付け、選別したいと考えています。

これは理にかなっています。しかし、残念ながら、外部の投資チャネルでは、非常に正確な人口ターゲティングを提供することができず、人口統計やコンテンツの好みなどの大まかな区分しか提供できません。これは、流通チャネルがユーザーのマーキングを非常に正確に行っていると一時的に信じており、マーキングエラーの可能性を考慮していないことも意味します。

したがって、新しいユーザーを引き付けるという点では、ユーザーをセグメント化する能力は限られていることがわかります。完全に不可能というわけではありませんが、非常に限られています。ユーザーセグメンテーションのより大きな可能性は、アクティビティを促進すること、つまり、ユーザーグループを分割することにあります。

例えば、グロースケースでは、同じページの同じ位置に異なるコピーや画像素材を配置して、バージョン間でA/Bテストを行うのが一般的です。どのバージョンを表示するかは自由に操作できる次元です。どのバージョンがより優れているかがわかれば、すぐに対処して、パフォーマンスの低い他のバージョンを置き換えることができるからです。したがって、表示バージョン ディメンションは、インジケーターをセグメント化するのに非常に適しています。

[概要] 部分が単なる監視である場合、[セグメンテーション] ステップにはすでに何らかの分析感覚が反映されています。 [セグメンテーション] ステップでは、分析結果をできるだけ早く実装できるように、実際的で実用的なセグメンテーション ディメンションを見つける必要があります。しかし、この部分にはまだ疑問が残ります。つまり、複数の運用分割ディメンションがある場合、それらの間には違いがあるはずです。

たとえば、グラフィックやテキストを単純に置き換えることもできますが、製品のメジャー バージョンを丹念に反復することもできます。

分析プロセスでこの操作の複雑さをどのように反映し、測定するのでしょうか?ここで[評価]の問題に移ります。

1.1.3 評価

[評価]ステップでは、[要約]ステップのターゲット指標を唯一の評価基準として使用する必要があります。目標が単純な GMV、またはさらに単純な PV と UV である場合は、[セグメンテーション] ステップの後で基本的に結論を導き出すことができますが、実際にはそうではありません。私たちの目標は複合的な目標かもしれません。GMV を増やす一方で、コストも管理する必要があります。 PVを増やすと同時に、GMVも増やす必要があります。または、ROI などの複合指標である場合もあります。

この時点で、ターゲット指標だけではなく、複合指標にも焦点を当てることができます。たとえば、私たちの目標はコストを抑制しながら GMV を増やすことです。問題をさらに単純化するために、コストを具体的には、GMV を生成するために古いユーザーを宣伝するコストと、GMV を生成するために新しいユーザーを獲得するコストとして定義します。通常、運営においては、新規顧客の獲得や活性化を促す手段が異なり、それは[セグメンテーション]部分の原則、すなわち運営の余地があるかどうか、運営スペースの大きさに該当します。

その後、新規顧客の誘致とアクティベーションの促進という異なる側面に応じて、生成された GMV と投資コストの 2 つの指標を細分化できます。たとえば、新規ユーザーの獲得という点では、外部の百度キーワード、外部の広告提携、他のアプリとのトラフィック交換などの協力を行っています。アクティベーション促進の観点から、アプリ上の4つのバナーABCDに対してA/Bテストを実施しました。

新規ユーザーに関しては、Baidu キーワード、広告提携、協力アプリを通じて、投資した 1 ドルごとにどれだけの新規 GMV を獲得できるかを評価できます。この評価を通じて、新規顧客を引き付けるさまざまな方法の中からより良い方法を簡単に選択し、既存の方法へのコスト投資を調整することができます。既存のユーザーについては、4 つのバナー ABCD に対して A/B テストを実施し、さまざまな表示バージョンに投資した 1 ドルごとにどれだけの GMV を生成できるかを評価することもできます。

つまり、[評価]ステップでは、[概要]部分の指標を、最終目標と目標を達成するための手段の2つのカテゴリに分割する必要があります。たとえば、前の例では、投資コストは GMV の増加を達成するための手段です。したがって、コスト投資の 1 ドルごとに、生成された GMV に基づいて評価する必要があります。現時点では、GMV を増やすという目標を達成するための選択肢は他にもあります。

たとえば、古いユーザーをアクティブ化するには、次のようにします。

  1. コストを変更せずに、GMV をもたらす可能性の高い画像とテキストを置き換えて、投資されたドルごとにもたらされる GMV を増加させます (効率を最適化します)。
  2. 1 ドルあたりの GMV を変更せずに、コスト投資を増やします (制限内で)。

どちらのアプローチも、GMV がもたらす可能性のある価値を意識的に無視しています。この価値を考慮に入れると、投資コストの一部を相殺することができ、より多くの選択肢が生まれます。

つまり、前の例では、分割ディメンション自体は比較的単純で、アプリ内のバナーと新規ユーザーを引き付ける外部の方法のみを考慮しているため、データ内のいくつかのマークを通じてセグメント化するのは比較的簡単です。しかし、実際には明確に区別できない状況も存在します。

たとえば、ユーザー インタラクションでは、GMV を生成するためのパスは複数のリンクを経由する必要があります。または、前の例の 4 つのバナー ABCD のように、ユーザーが 2 つまたは 3 つのバナーをクリックした場合、どのように分解すればよいでしょうか。この問題は次のステップ[帰属]です。

1.1.4 帰属

[帰属] このステップは「ラスト マイル」と呼ばれ、よく「なぜ」を分析するプロセスと呼ばれ、その後に結論を導き出して決定を下すことができます。

これまでの手順では、直接比較できる定量的な指標がいくつか得られたことが事例を通じて明確にわかります。この場合、実は[帰属]のステップで特別なことをする必要はなく、数値を比較することで直接結論を導き出すことができます。しかし、セグメンテーションの問題、つまり複数のリンクやメソッドを明確に区別できない場合はどうすればよいでしょうか。

日常のデータ分析では、一般的に使用されるアトリビューションのアイデアがいくつかあります。

たとえば、上記の例を続けましょう。ユーザーは ABCD の 4 つの位置を順番にクリックして GMV を生成しました。

  1. **初回インタラクション アトリビューション モデル**: これはユーザーが何かを初めて行ったときであり、通常は最も早い時間、最も小さいシーケンス番号などとしてデータに反映されます。次に、A に 100%、B、C、D に 0% を割り当てます。
  2. **最後のインタラクション アトリビューション モデル**: これは、ユーザーが最後に何かを行った時間を指し、データでは最新の時間、最大のシーケンス番号などとして反映されます。次に、D に 100%、A、B、C に 0% を割り当てます。
  3. **線形帰属モデル**: つまり、平均スコアです。そして、ABCDにそれぞれ25%を与えます。
  4. **加重帰属モデル**: つまり、複数の寄与要因に一定の重みを割り当てます。たとえば、A と B はそれぞれ 30% で記録され、C と D はそれぞれ 20% で記録されます。重量という追加の次元があるため、特定の設計が必要になります。重量を計算することも分析プロセスとして使用できます。重みを設定する一般的な方法はいくつかあります。たとえば、最初と最後の 2 つの項目が最も重要で、他の項目は順番に減っていく、または時間とともに減っていくなどです。

もちろん、アトリビューション方法を選択する際には、特定のビジネスの特性も考慮し、行動の順序、滞在時間、その他の要素、および分析目標への貢献度や影響度も考慮します。

1.1.5 意思決定

ついに決断を下すことができます。しかし、これまでのステップで不確実性が徐々に排除されると、意思決定は最も簡単なステップになります。つまり、最もパフォーマンスの高いバージョン、最もパフォーマンスの高い場所、そして新規顧客を引き付ける最良の方法を見つけることだけの問題になります。

新しいアイデアが浮かんだ場合は、それを A/B テストのバージョンとして追加し、この評価システムに追加して総合的に評価することもできます。

この一連の方法論は、日常業務における特別な分析を目的としているだけでなく、いくつかの確立された方法論にも見られます。

確立された方法論の例をいくつか見てみましょう。

1.2.1 A/Bテスト

最初に見ていくケースは A/B テストです。 A/B テストのプロセスでは、まず実験の目的、つまり実験を通じてどの指標を改善し最適化したいかを決定する必要があります。その後、実験における異なるバージョンをセグメンテーションの次元として使用し、指標が達成されたかどうかを評価基準として実験結果を評価しました。実験中に帰属を必要とする問題に遭遇した場合は、帰属方法も検討する必要があります。

もちろん、ビジネスの複雑さが増すにつれて、A/B テストの難しさは比較と結論を導き出すプロセスではなく、より短い時間で、より少ないユーザー トラフィックでより多くの実験を実施し、効果的な結論が得られるように実験を設計する方法にあります。これは、この分野のすべてのプラットフォームとツールの出発点でもあります。Google の有名な論文「Overlapping Experiment Infrastructure: More, Better, Faster Experimentation」の中核コンテンツです。

1.2.2 ユーザーのグループ化

ユーザーのセグメンテーションは一般的な運用方法ですが、セグメンテーションの精度をどのように判断し、その後の使用で精度を維持するかは、まさにデータ分析の問題です。機能ベースのユーザーセグメンテーションのプロセスでは、まずどのようなユーザーグループを獲得したいのかを確認します。

後で、この機能に該当するユーザーを見つける必要がある場合は、TGI (ターゲット グループ インデックス) を使用して、見つけたユーザー グループがこの機能に傾向があるかどうかを測定できます。たとえば、面白い短い動画を好むユーザーを見つけたい場合、いいね行動を「好き」の定義として使用すると、TGI のサイズを使用して、見つけたユーザー グループが面白い短い動画を好むかどうかを評価できます。

この分析メカニズムを使用すると、さまざまな手段でユーザーをグループ化し、異なるグループ化方法に対して複数の TGI 値セットを計算できます。必要なのは、TGI 値が最大であるサブグループであり、このサブグループを取得するグループ化方法を選択します。

一方、ユーザー セグメンテーションに関する別のシナリオがあります。ユーザー グループを取得し、このグループの特性を調査したい場合です。このとき、TGI をターゲットとして使用することもでき、TGI のサイズを使用して、さまざまな機能に対するクラスターの傾向を測定することができます。

1.2.3 古典的な経営モデル: BCGマトリックス

古典的な BCG マトリックスでは、全体的な利益に暗黙の焦点が当てられ、その手段はリソースの最適な割り当て、つまり、企業レベルで全体的な利益を最大化するために、企業の限られたリソースをより有望なビジネスに投資することです。

この目標について詳細な調査を行うために、この指標は BCG マトリックス内で 2 つの次元に分割され、2 次元マトリックスが形成されました。通常の描画方法では、水平線は相対的な市場シェア(通常は業界の上位 3 社との相対的なシェア)を表し、垂直線は市場の成長率を表します。相対的な市場シェアと市場成長率は利益を生み出す手段です。高い市場シェアと急速な成長があれば、当然より多くの利益を上げることができ、利益が当然究極の目標となります。

したがって、手段によってもたらされる利益が異なるため、4 つの象限では、さまざまなビジネスが独自の「運命」を持ちます。維持されるものもあれば、リソースを追加するものもあれば、リソースを削減するものもあり、直接放棄されるものもあります。

これまでの方法論の全体的な説明に基づくと、この方法論を最適化できるポイントが 3 つあります。

(1)概要

要約部分の最適化は、最終的な目標指標を計算するために、より新しく、より適切な補助指標を見つけることです。例えば、財務分野では、収支概要に基づく計算方法と比較して、デュポン分析では、売上率、資本運用、負債水準の3つの側面に基づく内訳方法が提供されており、理解しやすく、対処しやすいものとなっています。

(2)セグメンテーション

先ほどセグメンテーションについて説明したときは、主に時間、新規顧客を引き付ける既存の方法、バナーなどの客観的な側面に焦点が当てられていました。分析経験が蓄積され、アルゴリズム機能が向上するにつれて、分析とアプリケーションにさらに主観的な細分化の次元が徐々に追加される予定です。たとえば、ユーザー タグはユーザーの設定に基づいて作成されます。これらの次元は新たな視点を提供しますが、独自の「ゲームプレイ」も備えています。

(3)帰属

帰属部分は、客観的に決定できない分割ロジックに対して、人工的に定義された分割ロジックを提供します。人的操作の追加や客観的な条件の絶え間ない変化により、最適化空間が徐々に出現し、ビジネスの発展や環境の変化に適応するために分割方法を継続的に最適化する必要があります。

著者: Gu Qing、DTALK.org の創設者。公開アカウントDTalks(dtalks)をフォローして、「Renren PM」と返信してご連絡ください。

この記事はもともと @顾青 によって Everyone is a Product Manager に掲載されました。無断転載禁止

タイトル画像はCC0ライセンスに基づいてUnsplashから引用しています

<<:  業務におけるデータ分析の方法(データ分析思考は業務に必須ですが、あなたはまだデータ分析ができないと断言できますか?)

>>:  オペレーション戦略には何が含まれるか(経営理念:生産オペレーション戦略)

推薦する

データ資産管理の特徴(データ資産管理業界研究:データ要素の価値解放の礎)

データ資産管理業界の調査:データ要素の価値を解放するための基礎(レポート作成者/執筆者:ノースイース...

パルセーター洗濯機販売ランキング(ベストセラー洗濯機トップ5、品質良好、否定的なレビューが少ない)

ベストセラーの洗濯機トップ5、品質は良いが、否定的なレビューは少ない洗濯機は生活に欠かせない家電製品...

プロダクト マネージャーのやること (完全な製品ワークフロー: プロダクト マネージャーが行うべき 25 のこと)

製品完成ワークフロー: プロダクトマネージャーがやるべき 25 のこと製品の世界における数多くの永遠...

どのElementorテーマが最適ですか? Elementorテーマテンプレートの推奨

Elemento は、ビジュアル インターフェイスを通じて要素をドラッグ アンド ドロップすることで...

製品メディアプロモーション企画プラン(セルフメディアの時代において、企業はセルフメディアをどのように活用して自社や製品を宣伝できるか)

セルフメディアの時代において、企業はどのようにセルフメディアを活用して自社や製品を宣伝できるのでしょ...

製品オペレーションの職務内容(製品オペレーションの履歴書内容の記入方法)

製品操作の履歴書の記入方法基本情報名前: 7ポイント履歴書年齢: 27電話: 133****4812...

.euドメイン名の意味は何ですか? EUドメイン名の登録価格と要件

.eu ドメイン名は、欧州連合の国および地域トップレベルドメイン (euTLD) の国際トップレベル...

データオペレーションセンター(データセンターとは?知っておきたい知識ポイント!)

データセンターとは何ですか?これらの知識ポイントを知っておく必要があります!以下はデータセンターにつ...

モール運営内容(ショッピングモール開業後の運営管理のポイントと事例分析)

ショッピングモール開業後の運営管理のポイントと事例分析ショッピングモール開業後の総合管理は、 Yin...

新メディア運用 新メディア運用研修(新メディアをうまく​​運用するには?新メディア運用研修とは?)

新しいメディアをうまく​​運用するには?どのような新しいメディア運用トレーニングがありますか?インタ...

なぜアメリカ人は小紅書でSHEINについて議論することに熱心なのでしょうか?

中国と米国の人々は、小紅書間の和解が深まるほど、両者の間の情報格差が顕著になることに気づいた。当初の...

情報フロー広告営業業務(単一情報フロー広告からオンライン口コミマーケティングプロモーションまで、どのように実績を飛躍的に伸ばすのか?)

単一情報フロー広告からオンライン口コミマーケティングプロモーションまで、パフォーマンスの飛躍的向上...

美容ブランドのマーケティング戦略(TikTok 美容マーケティング: ブランドを次のヒットにする方法)

TikTok の美容マーケティング: ブランドを次のヒットにする方法ユニークなショートビデオ形式と...

実用的なOpenCartテーマテンプレートの推奨

OpenCt は、最も人気のある越境電子商取引プラットフォームの 1 つです。Web サイトの構築は...

全体的な生産および運用戦略には何が含まれていますか(生産および運用管理が直面する課題)

生産・運用管理の課題生産・運用管理とは、企業の生産システムの設計、運用、保守プロセスの管理を指し、以...