データ分析はどのように行うのですか?文:水水水 出典:データの自由を追求する杜氏 私は58に2年間在籍しています。インターネットトラフィックの初心者から現在に至るまで、私は多くの落とし穴に陥ってきました。私の知識が限られているため、多くの方法論的な事柄を十分に紹介できない可能性があります。しかし、まだ要約する必要があります。部門にそのようなニーズがある間、私はこの機会を利用してそれを整理するつもりです。 インターネットデータ分析の作業は、実は非常に体系的です。手元にある物を分類すると、次の 4 つのタイプに分けられます。
1 番目と 2 番目の方法は、本質的には、原因を説明したり説明を求めたりするときにデータの範囲を広げるという考え方です。拡大のプロセスでは、比較と構造を使用して、最終的にビジネスにおけるデータの変化を記述および説明します。 データの検証と分析は多岐にわたり、対処すべき状況も多岐にわたるため、データアナリストの経験と技術的介入能力に依存します。 競合製品の分析にはマクロ構築能力が必要です。優れたフレームワークは、大量の複雑で非標準のデータからエントリ ポイントをすばやく見つけ、迅速に結論に到達するのに役立ちます。 データを拡張することは方法であると同時に意識でもあります。そう言う理由は、2つの背景に基づいています。 1 つ目は、データの保存形式が、粒度の異なる散在した長いテーブルの形式になっていることが多いことです。 2 つ目は、私たちが行う分析は、細かい指標チェーンのような直感的なプレゼンテーションに基づいているため、幅広いテーブル認識が、データ抽出の可能性と最終的な結論を結びつける架け橋となることです。 したがって、このプロセスでは、広いテーブル粒度の主キーを明確に検討する必要があります(アクティブエンタープライズ効果分析)。たとえば、アクティビティ分析の主キーはチャネル番号、ユーザー トラフィック分析の主キーは Cookie または UID、推奨の主キーはユーザー ID とオブジェクトの位置 ID の組み合わせです。分析プロセスは、ワイドテーブルを作成するプロセス(特に分析プロセスは探索に基づいており、4〜6ポイントのさまざまな要求などがある)、複数の注文の中から最初と最後の注文指標を見つけるプロセスなどであると個人的に考えています。ビジネスの内容をワイドテーブルに抽象化できると、ビジネス目標を独自のデータ目標に抽象化できます。実は、このような考え方はオペレーションに最も欠けており、オペレーションでは常にすべてのデータを接続したいと考えていました。 これらのことを十分に検討した後にのみ、各次元に必要な測定指標を追加できます。たとえば、ユーザー トラフィック分析では、各リンクの動作特性と情報特性を定義する必要があります。これは簡単であると同時に難しいことです。行動特性の定義には、決定的な内容を導き出すために多くのビジネス知識が必要です。さまざまな行動特性をつなぎ合わせることは、実際には技術的な問題です。 これまでにも、主要なイベントのインベントリ分析を数多く実施してきました (BOSS 影響分析、アプリ トラフィック減少分析、M トラフィック変化分析)。これらの分析プロセスは、イベントベースの分析として理解できます。影響の時間軸の順序を選択し、2 つの時間指標の差を測定および比較するための主要な指標を選択することが非常に重要です。つまり、実験を行うのと同じように、実験グループと対照グループを選択するプロセスです。グループ + 主要指標の選択は、分析上の結論をうまく導き出すための鍵となります。前の時点と後の時点をより適切に比較することが難しい場合は、時間軸を粒度として折れ線グラフを作成することもできます。ここはビジネスイベントの代替として最適な場所です。不明瞭な場合は、構造を分割して行を確認します。何回か分割すると、安定する線もあれば、大きく変動する線もあります。考慮すべきなのは変動の大きさです。 指標の影響は、一般的に、分析したい主要なコンテンツを中心に展開します。 BOSS 影響分析は、リリース トラフィックとアクティブ インジケーターを中心に行われます。アプリのトラフィック減少分析指標は固定されているため、新規ユーザーと既存ユーザー、アプリの必須登録戦略など、説明に役立つ構造的なコンテンツが多数見つかりますが、そのほとんどはビジネス理解に基づいています。 正確なデータが不十分な場合や水平比較が必要な場合、特に(競合製品の分析、Fanxing輸入のプラットフォームへの影響の分析、前後の比較)を行うときは、多くの構造分析と比較が使用されます。構造分析では棒グラフが多く使用され、有利な構造と不利な構造が一目で分かります。この分析方法では対数の問題も回避されます。欠点は不正確であることです。 事前に検証した主要な影響要因の内容を、探索的分析に可能な限り反映させる必要があります。特に、原因究明の過程では、新規ユーザーと既存ユーザーの割合、有料チャンネルの割合なのか、マーケティング補助金を受けたユーザーの割合なのかなど、これまで検証してきた要因をワイドテーブルに追加していく必要があります。 ファネルは、新製品の検証や運用戦略に頻繁に使用されます。この一連のことは、グロースハッキングの理論と非常によく似ています。ここで重要なのは、データがプロセス ノードの動作をどのように定義するかです。プロセス ノードとその基礎となる MVP は、実際の状況のニーズのデータと組み合わせられます。つまり、それは束縛の下で踊り、さまざまな制限条件の下で実際的な問題を解決しているのです。 密度分析法は一般的に使用されていません。使う場面としては、通話時間の分布など、密なラベルがたくさんある場合に主に使います。ユーザーは主キーであり、当然配布形式となります。本質的には、ラベルが十分に少ない場合は、棒グラフ分布になります。ここでの使用法はカイ二乗に似ています。性別やチャネルなどの他のカテゴリ変数と比較すると、ここでの分布の偏りは一目瞭然です。つまり、これも平均の延長です。 データの検証における最大の難しさは、データの正確さを測定するためのアンカー指標を見つける必要があることです (最大の難しさは、ビジネス コードに関連する最終状態テーブルの検証であり、フロー テーブルはケース テストを通じて実現できます)。そして、問題を発見した後、データの原理を理解して修正の可能性があるかどうかを確認します。例えば、-1 ソースからの履歴書が正確に何であるか (構造比率、登録ソース、履歴書の完全性で測定)、履歴書テーブルの更新時間に、ログイン後の自動更新が含まれているか (構造比率を確認するには、ログイン時間を調べてください)、ポジションの支払い状況と会社の支払い状況は同じものであるか (一致する状況を比較し、一致しない状況を比較し、クロスチェックで確認します。問題が引き続き発生する場合、たとえば、会社に無料のポジションと有料のポジションの両方がある場合、登録時間を通じてさらに確認できます) などです。
たとえば、-1 再開ソースの問題に関しては、前の 2 つのプロセスは、これがシステム バグ データの問題であるかどうかを判断するのに役立ちます。 競合製品の分析では、さまざまなデータの比較が非標準かつ大規模であり、純粋な探索はコストがかかりすぎて非効率的であるため、トップダウン モデルに大きく依存します。 |
<<: 企業にとってのビジネスデータ分析の重要性(なぜ企業はビジネス分析プラットフォームを必要とするのか?)
>>: ビジネス データ分析ダッシュボード (目に見える洞察: モバイル データ ダッシュボードを使用してビジネスを詳細に分析します。管理者にとって必須のツールです)
ブログ プラットフォームとして、ユーザーは WodPess を使用して、PHP および MySQL ...
6月の贛州で最も強いコミュニケーション力を持つ新しいメディアはどれでしょうか?最新のリストはこちら...
https 証明書と SSL 証明書は同じですか? SSL 証明書と https 証明書は、名前が異...
ご存知ですか:これらの家電ブランドは、実はすべて同じ系列のブランドです。よくこう聞かれます。「ブラン...
コンテンツのプロモーションはどうすればいいですか?これらのポイントをマスターすれば、簡単に高品質なコ...
未来への窓を開くために一緒に働きましょう!江西省仏山市南昌市商工会が正式に設立されました市場経済環境...
文化的な出会い、Si Te Liquorがブランドマーケティングをどのように展開し、高品質な開発の基...
たった3つのティーテーブルで月商56万?シェア茶屋で儲ける秘密を暴く(写真はBOSS LOUNGE共...
FlshFXPの使い方は? FlshFXP はどのようにサーバーに接続しますか?この記事では主に、F...
ウーコマースこれは、WodPess 用のオープンソースの電子商取引プラグインです。強力な WooCo...
情報フロー広告職の面接を受けていますが、経験はありませんか?早くオファーを得るためにこれらの質問を準...
ブランド企画会社はどのようにして優れたブランドストーリーを書くのでしょうか?ブランドストーリーを書く...
製品操作の履歴書の記入方法基本情報名前: 7ポイント履歴書年齢: 27電話: 133****4812...
年次総会の共有第19回コールセンター産業発展年次大会2023が8月25日に大同雲岡建国ホテルで成功裏...
「乾物」情報フローの創造的なライティングのための 7 つのルーチン + ケースを整理しました。数日...