指標システムに基づくデータウェアハウス構築とデータ可視化序文 データ作業における私の経験を共有する記事をまとめていきます。業務内容の違いにより、全員の理解に一貫性がなく、シナリオ内のさまざまな特殊性を理解できない可能性があります。しかし、継続的なコミュニケーションと交流によって多くの問題を解決できると信じています。先ほど、職場の基本スキルとデータ指標システムについて分析しました。今日は前回の記事で紹介した指標システムをベースにしたデータウェアハウスの構築とデータの可視化についてお話しします。 歴史的紹介: 小規模上級者向け: データ指標システムとデータガバナンス管理 ヒント: 配達品質で競合他社に勝つように努めましょう 以下、お楽しみください: 前回の記事では、インジケーター システムを構築する必要がある理由について説明しました。指標システムの役割と重要性をまだ理解できない場合は、歴史的紹介を通じて前の 2 つの記事を確認するか、WeChat グループに参加して全員とコミュニケーションをとることができます。ここでは指標システムを確立することの重要性を2つの文章で簡単に説明します。
データ インジケーター システムのないチーム内のデータ需要は、多くの場合、「膨張した」現象として現れます。誰もがデータに対して独自の視点と要求を持っており、非専門的な方法で次元/指標のデータ キャリバーを作成します。データ実践者は膨大なデータ要求に巻き込まれており、ビジネスルールに基づいて設計されたソリューションを抽出することは困難です。最終的には、維持管理が難しい「煙突型」のデータ ウェアハウスを構築することになります。 データ視覚化ソリューションを提供するプロセスには、データ ウェアハウスの構築と同じ問題が依然として存在します。データ視覚化レポートの数は増加していますが、利用率は低く、データレポートがいくつあっても、データのニーズを満たすにはほど遠い状況です。長期的には、メンテナンスコストは高いままであり、効率率は十分に高くありません。これはデータ実践者にとって非常に憂慮すべきことです。他にも気になる問題があり、引き続き深いコミュニケーションと理解を深めたい場合は、コメントを残したり、WeChat グループチャットに参加してコミュニケーションをとったりしてください。 データ ウェアハウスの階層化の問題を簡単に思い出し、データが整然と流れるように「広く薄い」データ ウェアハウスの階層化を行いましょう。データ チェーンのライフ サイクル全体は、レイヤーを通じてのみ、ユーザーがクリーンアップして明確に認識し、利用できるようになります。レイヤー間の依存関係、循環依存関係、または多重依存関係があると、データの問題が頻繁に発生し、保守が困難になります。
したがって、データをより秩序立てて効果的に整理し、管理する必要があります。
データ ウェアハウスの階層化の観点から見ると、ODS レイヤーはビジネスに近く、その形式は主にビジネス データの形式に依存します。 APP レイヤーは使用シナリオに近く、データの表示方法と消費方法によって異なります。 DW 層は中間層であり、重要な拡張の役割を果たしており、大量のデータ処理と計算の責任を担っています。 データ ウェアハウスの上記の階層ロジックを考慮すると、結論を導き出すのは難しくありません。
DW レイヤーだけが、データ プロデューサーに大きな余地を与えます。優れた(高度にスケーラブルな)DW レイヤーをどのように設計するかが、データ ウェアハウスの重要な標準です。多くの学生が DW レイヤーを構築する過程で、「理想は非常に良いが、現実は非常に残酷」であり、構築されたデータは「根拠がなく実用的ではない」という同様の問題に遭遇し、依然としてデータ需要の問題を解決できず、常にビジネスの発展と変化に追いつくことができないと考えています。 したがって、今後は、まず指標システムを確立し、その指標システムに基づいてデータ ウェアハウスを構築するのがよいでしょう。当社の共通指標システムには、一般的に次のものが含まれます。
例: 製品のフレームワークに基づいて、信頼できるデータ マトリックスを整理するのが最適です。しかし、現実には、製品フレームワークに基づくさまざまなレポートの指標の能力や計算ロジックは異なる場合があります。したがって、データ マトリックスは、特定のレポートに基づいた小さなターゲット マトリックスになる可能性があります。
注: データ マトリックスと同様に、同じインジケーター名でも、データ レポートによってデータ キャリバーや計算ロジックが異なる場合があります。したがって、インジケーターの口径の定義にいくつかの調整を加えることができます。例えば、口径や計算ロジックが異なる場合は、異なる指標名を区別する必要があります。または、同じ指標名の場合、指標の口径の定義を説明して、違いがどこにあるかを視聴者に知らせる必要があります。 一般的なデータ ウェアハウスの構築とデータの階層化は、大きく分けて 2 つのモードに分けられます。
最下層からアプリケーション層までのデータ ウェアハウスの構築では、需要がまだ明確でないときにデータ開発作業を実行することに重点を置いています。まず、データの前処理が実装され、データの収集とドッキング、およびデータ主体の分類が適切に行われます。データ消費シナリオが実装されるときに機能を迅速に開発するため。このモデルは汎用性が高く、広く使用されていますが、多くの冗長性と不合理な設計も引き起こします。実際のニーズに対応する場合、拡張性が悪く、再構築の可能性が高いです。 もう 1 つのモデルは、明確な要件に基づいて、基礎となる需要からデータ ウェアハウス モデリングを導き出すことです。要件を通じて、プロジェクトに関わるすべての関係者は、ビジネス要求を迅速に理解し、目標に対する理解を統一することができます。ビジネスニーズとデータウェアハウスの関係を高品質に整理し、ターゲットを絞ったデータウェアハウスを構築します。しかし、データ構築は「煙突型」の構築になりがちで、限られたシナリオしか満たさず、再利用性が低いという批判も残っています。 指標システムに基づいてデータ ウェアハウスを構築することで、主に「モデル A」におけるデータ シナリオの考慮が不完全であるという問題が解決されます。データの使用シナリオを総合的に考慮しないと、再利用性が低い「煙突型」のデータ構築になってしまいます。データのニーズが、全体的な理解と計画なしに「点状」の断片の形で提案された場合、データ ウェアハウスの構築は「点状の煙突スタイル」でしか対象にできません。ニーズを体系的に出力できれば、ビジネスシナリオで必要な次元や指標を整理することができます。これにより、データ モデリング プロセスにおける「煙突型」の問題が最大限に解決され、データ構造が「幅広く薄い」ものになります。 例えば、次のデータマトリックスがあります -w505 次に、選択できるデータウェアハウス階層モデリング手法は次のとおりです。 -w713 説明ライブラリ。表 1: データの視覚化、データ アプリケーション サービス、および多次元クエリは、APP レイヤーのデータ テーブル サービスを通じて提供されます。 Library.Table 2: 他のリアルタイム テーブル (Library.Table 3) またはディメンション テーブル (Library.Table 4、5) と関連付けて APP レイヤーのデータ テーブルを生成することによって生成されるリアルタイム詳細テーブル。ライブラリ.表6: 埋め込みデータ、またはビジネスライブラリから接続されたビジネスデータ(注文データなど)によって生成されたログテーブル 著者: Xiao Ji は、有名なインターネット企業の製品エキスパートであり、データの収集、生成、処理についてある程度の知識を持っています。彼は、適切な質問をし、ビジネス価値を発見するための基礎としてデータを使用します。 |
<<: 運用データ化(商品のデジタル運用を説明するマインドマップ:トラフィックと売上高を増やすためのツールとモデル)
>>: 運行データ統計表(2021年12月の地下鉄乗客数データが公開され、厦門は1,800万人近く、福州は1,100万人近く)
チーフニューメディアオペレーターアカデミー創設者の李翔氏:運用データレポートを完成させる3つのステッ...
**ビールカルチャー株式会社 経営企画プログラム**ビールカルチャー株式会社 運営・管理計画プログ...
配置資料はどこで見つかりますか?上級オプティマイザーがプライベートチャンネルをあなたと共有します序文...
ワイルドカード SSL 証明書は、ドメイン名とその下のすべての第 2 レベルおよび第 3 レベルのサ...
コード署名証明書は、主にソフトウェア開発者に提供され、開発したソフトウェア コードにデジタル署名する...
詳しく解説!あらゆる業界に適用できるコミュニティ運営の4段階方式以下の記事はPai Ye Oper...
WodPess ファイアウォール プラグインは、Web サイトが悪意のある攻撃を受けているかどうかを...
ソーシャルメディア収益化の方法とテクニック:プライベートドメイントラフィックとユーザー操作画像ソース...
ソーシャル メディアが主流の時代に、Z 世代の起業家たちはオンライン ビジネスの成功基準を再定義して...
2023年の掃除機、掃除ロボット、床洗浄機のEコマース販売データの分析「巣ごもり経済」などの生活習...
ドメイン名証明書とは何を意味しますか?ドメイン名を登録したユーザーなら、ドメイン名証明書について聞い...
開封王坡は長沙の仲人です!個人の IP はどのようにして都市にトラフィックをもたらすのでしょうか?...
NetEaseとBlizzardの分裂の背後にある謎と問題著者: 孫宇、呉麗洋、蔡淑悦編集者:朱一...
新製品を効果的に宣伝するにはどうすればいいでしょうか?スタートアップ企業や個人は、どうすれば自社製品...
0からユーザーライフサイクルオペレーションまで、ユーザー中心のフルリンクマーケティングソリューショ...