ビジネスデータ分析のやり方(データ分析をうまく行うための6つのステップ)

ビジネスデータ分析のやり方(データ分析をうまく行うための6つのステップ)

優れたデータ分析のための6つのステップ

この記事では、実際のデータ分析手順に焦点を当て、分析の実行方法を詳しく説明します。

元米国郵政長官で、アメリカの百貨店の父であるジョン・ワナメーカー氏は、「広告に費やしたお金の半分は無駄になっているが、問題はどの半分が無駄なのか分からないことだ」と嘆いた。

同じような叫び声が今、私たちの周りでよく聞かれます。

学生 A: プロジェクトが完了した後、プロジェクト データを取得して、自分の計画がデータの増加をもたらしたかどうかを確認しました。しかし、目の前の Excel テーブルに大量の密集した数字が並んでいるのを見て、どこから始めればいいのかわかりませんでした...

学生 B: 彼は、多大な労力を費やしたプロジェクトデータを入手した後、プロジェクトで実装したいくつかのソリューションを検証することに熱心でした。彼はプロジェクトの過去のデータも比較しました。多大な努力の末、全体的なデータが増加したことがわかりましたが、影響要因が多すぎたため、どの具体的な解決策が機能したのかはわかりませんでした...

私たちがよく遭遇するのは、データをどのように使用して実用的な効果をもたらすのかわからないということです。前回の記事「データをどのように活用してデザインを導くのか?」「デザイナーにとってのデータの価値」では、デザイナーにとってのデータの価値、データとは何か、いつデータを見るべきか、データに基づくデザインの基本的な考え方について説明しました。この記事では、実際のデータ分析の手順に焦点を当て、その実行方法について詳しく説明します。

データ分析は主に、X の質問の作成、仮説の提案と指標の選択、データの収集と整理、データ分析、データの提示、フォローアップの推奨事項の作成という 6 つのステップに分かれています。

以下では、これら 6 つのステップに焦点を当てて、各ステップの実行方法を詳しく説明します。

本質的に、データ分析の最終的な目標は問題を解決することです。異なる開始点から得られるデータ結果は大きく異なる可能性があります。したがって、すべての分析は、解決すべき重要な問題が何であるか、そしてなぜその問題が最も重要であるかを特定することから始めなければなりません。これら 2 つの質問は、データ分析の目的を明確にするという、問題を組み立てるプロセスにつながります。

(1)どこから始めるか:

① 予測分析については、既存の戦略計画に基づいて対応する定量的な測定方法を見つけることができます。たとえば、プロモーション ページ A のメリットを強調してユーザーの購入を促進しようとする場合、X の質問を「メリット情報を強化することでコンバージョン率を高めることができますか?」と直接設定できます。

② 予測分析(問題や機会の発見)がなければ、問題構築の出発点はビジネス視点でのビジネス目標となることが多く、指標分解、経験判断、水平比較、論理的推論などを通じて効果的な実施方法が模索されます。例:電子商取引プロモーションページBの中核目標は「GMV(売上)の増加」であり、GMV = トラフィック * コンバージョン率 * 平均注文額です。コンバージョン率、平均注文額、その他の指標の改善を中心としたソリューションを探すことができます。

(2)重要かどうかを判断する

① 予測問題の場合、検証結果が信頼できるかどうかを評価するための指標を直接探すことができます。

②予測(問題や機会の発見)がない場合は、問題解決後に最も重要なビジネス目標がどれだけの利益をもたらすかを評価できます。例えば、上記のGMV増加のケースでは、同種のページのデータを横並びで比較すると、このページのコンバージョン率は1.8%で、類似ページのコンバージョン率4.7%よりも大幅に低いことがわかりましたが、トラフィックと平均注文額は類似ページとほぼ同じでした。そのため、コンバージョン率は「GMV(売上)を上げる」ためのキーポイントとなる可能性が高いと判断され、「コンバージョン率を向上させるためのキーファクターは何か」が、このページのデータ分析における重要な課題と定義できます。

(3)X問題を定義する

さまざまなタイプに応じて疑問文で表現できます:how/which/whether/what is the reason… 経験によると、洗練後の一般的な問題は次のカテゴリに分類でき、それぞれはX問題で説明できます。

  1. 実験検証カテゴリ: すでに仮説と計画があり、その効果を検証する必要があります。たとえば、ABC の 3 つの戦略のうちどれがコンバージョン率の向上に効果的か、戦略 A はコンバージョン率の向上に役立つかどうかなどです。
  2. 原因の発見: 特定の現象を見て、その背後にある理由を見つけたいと考えます。たとえば、直帰率が急激に増加した理由は何かなどです。
  3. プロジェクトDのコンバージョンや売上状況をデータで提示するなど、先入観を持たずに事実を提示する結果提示型。
  4. 予測型は、年間を通じてユーザーによる美容製品の購入に時間的パターンがあるかどうかなど、起こっていることのパターンを見つけることで、次に何が起こるかを予測します。美容カテゴリーの事業者は、このパターンに基づいて年間活動計画を策定することができます。

(4)質問が広範囲になりすぎないように注意してください。

多くの場合、信頼性が高く決定的な結論に達するには、データを収集し、それを検証可能な仮説に適用する必要があります。質問が広すぎると、データ収集が非常に難しくなります。たとえば、「プロジェクト D のデータ効果は向上しましたか?」この例では、「改善されたか」の方向性としては、新規顧客獲得効果は改善されたか、売上は改善されたか、直帰率は改善されたかなどが考えられます...

非常に多くの方向があり、あらゆる方向を探索すると、分析が無限の海に迷い込んでしまい、道に迷ってしまいます。しかし、問題の範囲をあまり早く限定しないでください。最初は、問題についてオープンな姿勢で考え、頭の中でいくつかの方向性を思い描きます。たとえば、「プロジェクト D の売上向上につながる可能性のある状況は 1、2、3 です。予備データに基づくと、3 の可能性が高いです。」その後、3 の方向で詳細な分析を実施できます。

前のステップでは、データ分析の目標である X 問題を特定しました。次に、問題Xに焦点を当て、その問題に対する結論仮説を提案し、仮説が有効かどうかを検証するためのモデルを構築(測定指標を選択)します。

1.2.1 仮説を提案する

事前に設定された質問の場合、ソリューション A はコンバージョン率の向上に役立つなど、質問から直接仮説を導き出すことができます。実装されていない問題については、その問題に関する考えられる仮説をすべて検討する必要があります。たとえば、ページ E の直帰率は急激に低下します。考えられる理由は次のとおりです:

  1. トラフィックソースのユーザーの質が低下しました。
  2. トラフィックの入口に間違った情報が含まれているため、ユーザーは期待どおりに進入できずになってしまいます。
  3. 最初の画面での製品選択に関する問題。
  4. 最初の画面の情報デザインはユーザーにとって理解しづらく、魅力的ではありません。
  5. ページの読み込みなどに問題があります。

1.2.2 仮定に基づく指標の選択

異なるタイプの仮説には異なる測定方法が必要であり、一部の仮説では検証に定性的な調査が必要になる場合があります。電子商取引の定量データの範囲に関しては、次のアイデアを参考にすることができます。

  1. トラフィックに関する想定では、各チャネルからのトラフィックソースの閲覧UV/PVやUV/PVなど、トラフィックに関する指標を選択できます。
  2. 売上前提については、受注金額、受注数量、コンバージョン率、UV値などの受注関連の指標を選択できます。
  3. ユーザー行動の推定に関しては、クリックUV/PV、ページクリック率、露出クリック率、一人あたり平均クリック数、閲覧深度など、ページ操作に関する指標を選択できます。
  4. ユーザー人口に関する想定に関しては、性別、年齢、都市レベル、新規ユーザーと既存ユーザーなどのユーザーポートレートデータを選択でき、ページ操作データを組み合わせて詳細な人口行動分析を行うこともできます。

データ ソースは定量的データと定性データに分けられます。定性データは研究方法に傾く傾向があります。この記事では、定量的データの収集と整理に焦点を当てます。

1.3.1 データ収集

さまざまなプラットフォームからの生データは、指数関数的な爆発段階に入りつつあります。電子商取引プラットフォームだけを見ても、さまざまなデータ指標は非常に多く、複雑です。取得前の段階では、データ製品または開発者と次の点を明確にすることが重要です。

  1. データ指標の計算ルール。
  2. データが必要なときにデータが存在しなかったり、データの計算方法が不合理であったりする状況を回避するために、必要なデータ指標のリスト(対応する期間とプラットフォームを含む)が必要です。

1.3.2 データの照合

データ整理の最初のステップはデータのクリーニングです。元のデータ テーブルには、テスト データ、外れ値、ギャップなどの汚れたデータが大量に含まれていることがよくあります。これを計算や分析に直接使用すると、偏ったデータの結論が導かれたり、計算が不可能になったりする可能性があります。データクリーニングとは、元のデータ テーブルを、計算や分析が簡単にできるクリーンで整頓されたデータ テーブルに処理することです。

主なものは次のとおりです:

  1. 重複データを削除するには、Excel の COUNTIF 関数を使用するか、フィルターと並べ替えを使用します。
  2. データ形式を確認してください。元データには、N/A、####、性別を数値として示すなどの特殊な形式が含まれている場合があります。実際の状況に応じて、どのように処理するかを決めることができます。
  3. 最小値、最大値、小数点、負の数などに注目して異常なデータをチェックします。明らかに実際の状況と一致していない場合は、原因を突き止め、データを削除するか再抽出するかを選択できます。
  4. 最も一般的な状況である欠損データの処理では、欠損値が 10% 未満であることが一般的に受け入れられる基準です。これを超える場合は、再抽出する方法があるかどうかを検討する必要があります。
  5. データ ロジック エラーを確認するには、ページのクリック率 = クリック UV/ページ閲覧 UV を計算するなど、計算と検査のためにデータをサンプリングできます。計算されたページのクリック率が 100% を超える場合は、データに異常がある可能性があるため、指標の統計方法が正しいかどうかを再確認する必要があります。

1.3.3 データ処理と計算

データが整理されたら、初期データ処理を実行できます。元のデータが分析要件を満たしていない可能性があります。たとえば、特定のモジュールのデータを確認したいが、元のデータがクリック位置ごとのデータに分割されている場合、各クリック位置のデータを合計してモジュール データに変換する必要があります。

また、業界標準の計算式を使用して複数の指標を数学的に計算し、別の指標を取得する一般的な状況もあります。たとえば、単一の UV 値 = GMV/ページ UV、注文変換率 = 紹介された注文数/ページ UV、1 人あたりの平均クリック数 = クリック PV/クリック UV などです。このステップを通じて、仮説を検証するために必要ないくつかの基本的な指標のデータを最初に確認できるようになります。

データがソートされたら、本当のハイライトであるデータ分析を開始します。これは最も重要なステップでもあります。データ分析には、非常に基本的でありながら極めて重要な考え方があります。それは「比較」です。基本的に、分析の 90% 以上は比較から切り離すことはできません。

2.2 仮定と測定指標の考え方に従い、「戦略 X はページ A のコンバージョン率を改善できる」という仮説を立て、この仮説の測定指標を「ページコンバージョン率」と定義します。ページコンバージョン率インジケーターを取得した場合、どの程度のコンバージョン率が良好と見なされるのでしょうか?これは戦略 X によってもたらされた改善によるものでしょうか、それとも時間の経過とともに自然に増加したものなのでしょうか?この時点で、比較を通じて分析することができます。

  1. 垂直比較:時間軸では、ページ A と比較して、戦略 X を使用した後のページコンバージョン率は増加しますか?
  2. 水平比較:同じ期間の同じ種類のページ (ページ B) を選択し、古いページ A、新しいページ A、新しいページ B のコンバージョン率を比較します。
  3. 経験と比較する:より長い期間を使用して、ページ A のコンバージョン率がどのように変化するかを確認し、戦略 X の使用が時間パターンに基づく予想値よりも高いかどうかを確認できます。さらに類似したページを選択し、同じ期間のコンバージョン率を比較して、A のコンバージョン率がどの程度であるかを確認できます。
  4. ビジネス目標との比較:大きなビジネス目標が実際に 2,000 万の GMV であり、ページ閲覧 UV と UV 値が安定している場合、目標コンバージョン率 = 目標 GMV/ページ閲覧 UV/UV 値を計算し、目標コンバージョンと現在のコンバージョンのギャップを比較します。

あらゆる角度から比較することで、現在の指標をより明確に理解し、それに基づいて次の計画を立てることができます。

1 つの記事の長さの制限により、この記事では 6 つのステップのうち最初の 3 つのステップのみを紹介し、いくつかの基本的な分析のアイデアを簡単に提示します。以降の一連の記事では、最後の 3 つのステップ (データ分析、データの提示、その後の提案) について、さらに詳しく説明します。

参考文献:

Zhang Wenlin、Liu Xialu、Di Song、「初心者はデータ分析ができないと誰が言ったのか?」、Electronic Industry Press

トーマス・ダベンポート金振豪(米国)「データアナリストになる」浙江人民出版社

ミルトン、M. (米国) 「シンプルな用語によるデータ分析」 電子産業出版

著者:胡耀、WeChat公開アカウント:JDデザインセンターJDC(ID:JDCdesign)

ソース:
https://mp.weixin.qq.com/s/zurv3PejUz0DlrUgsSb84w

この記事は、@Jingdong Design Center JDC の許可を得て、Everyone is a Product Manager に掲載されています。著者の許可なく転載することは禁止されています

タイトル画像はCC0ライセンスに基づいてUnsplashから引用しています

<<:  ビジネスデータ分析のやり方(データ分析はこのように行われます)

>>:  運用データ分析を行う方法 (新しいメディア運用とデータ分析: データを活用して運用上の意思決定を行う方法)

推薦する

ブランド市場運営(市場、ブランド、販売、運営の曖昧な関係について)

市場、ブランド、販売、運営の曖昧な関係について声明:著者はブランディング、マーケティング、オペレーシ...

ワイルドカード SSL 証明書でサポートされているドメイン名は何ですか?ワイルドカード SSL 証明書ドメイン名マッチングルール

ワイルドカード SSL 証明書でサポートされているドメイン名は何ですか?ワイルドカード SSL 証明...

三会の主な運営内容(中国保険協会は保険業界のコーポレートガバナンス慣行に関する4つの基準を発行し、「三会」の組織と運営手順を明確にした)

中国保険協会は保険業界の企業統治慣行に関する4つの基準を発表し、「3つの会議」の組織と運営手順を明確...

データに基づく運用能力(ユーザー増加の背後にあるデータ能力のインベントリ)

ユーザーの成長を支えるデータ機能のインベントリ1. はじめに近年、ユーザー増加という概念が市場で話題...

seoBeijing (北京の SEO 最適化: 私たちが犯したいくつかの SEO ミス)

北京の SEO 最適化: 私たちが犯したいくつかの SEO ミスエラーが発生しました。検索エンジン最...

Baota Linux Panel 7.9.0 オンラインインストールチュートリアル

Baota Panel は、Linux および Windows システムをサポートする、シンプルで使...

推進プロジェクト計画(カスタマイズ農業:ジャック・マーのアイデアの一つ、小規模農家に適した、新しいマーケティングモデル(計画付き))

カスタマイズ農業:ジャック・マーのアイデアの一つ、小規模農家に適した新しいマーケティングモデル(計画...

遺産ブランド計画(広東省文化観光:無形文化遺産の活性化、特色発揮、文化と観光の融合による継承促進)

広東省文化観光:文化と観光の融合による無形文化遺産の活性化、特色発揮、継承の促進China.com、...

データ操作とは具体的に何をするのでしょうか(データ分析求人検索)

データ分析求人検索これは私たちの乾物の最初の品です。毎日更新のリズムを保ち、皆さんと共有できるように...

企画・プロモーションとは何ですか? (インターネット企画・プロモーション)

ネットワークの企画と推進上海ウェブサイト構築会社 - ウェブサイト制作とデザイン - カスタマイズウ...

Semrush はどのくらいの期間無料で使用できますか? Semrushの無料利用期間

Semushを無料で利用できる期間はどのくらいですか? Semush は、世界的に人気の高いオンライ...

市場志向型運営メカニズムの内容(第三製鉄所では市場志向型運営メカニズムを徹底実施)

3つの製鉄所は市場志向の運営メカニズムを徹底して実施している3つの製鉄所は市場志向の運営メカニズム...

深センASO(モバイルゲームの運営とプロモーション、Testin Cloud Testing ASOサロン広州-深セン駅が終了)

モバイルゲームの運営とプロモーション、Testin Cloud Testing ASOサロン広州深圳...