実用的なヒント |データ ウェアハウスを階層化する必要があるのはなぜですか?(1)なぜ階層化が必要なのか? データ プランナーとして、私たちはデータが秩序正しく流れ、データのライフ サイクル全体が設計者とユーザーによって明確に認識されることを望んでいます。直感的に言えば、図のように階層が明確で依存関係が直感的にわかります。 しかし、ほとんどの場合、私たちが完成させるデータ システムは複雑で、混沌とした階層構造を持っています。下の図に示すように、気付かないうちに、混沌としたテーブル依存関係構造や循環依存関係を持つデータ システムを作成してしまう可能性があります。 したがって、データ システムをより整然としたものにするためには、効果的なデータ編成および管理方法のセットが必要であり、これをデータ階層化と呼びます。データの階層化によってすべてのデータの問題を解決できるわけではありませんが、次のような利点が得られます。 1) 明確なデータ構造:各データ レイヤーには範囲と責任があり、テーブルを使用するときに見つけやすく、理解しやすくなります。 上記の利点を満たすために、データ モデルは通常、データ操作層 (ODS)、データ ウェアハウス層 (DW)、データ アプリケーション層 (APP) の 3 つの層に分割されます。簡単に言えば、ODS 層には元のアクセス データが保存され、DW 層には設計に重点を置きたいデータ ウェアハウス中間層のデータが保存され、APP は業務に合わせてカスタマイズされたアプリケーション データであることがわかります。これら 3 つのレイヤーの設計については、以下で詳しく説明します。 (2)データモデルの階層化 1) ソースデータレイヤー (ODS) 2) データ ウェアハウス層 (DW) このレイヤーは 3 つのレイヤーに分けられます。 中間層 DWM (Data WareHouse Middle) : データ統計用に作成された中間テーブルデータである中間データを格納します。このデータは通常、複数のディメンションの集約されたデータです。このデータ レイヤーは通常、DWD レイヤーのデータから取得されます。 ビジネス層 DWS (データ ウェアハウス サービス) : 幅広いテーブル データを格納します。このデータ層は、特定のビジネス分野の集約されたデータです。ビジネス レイヤーのデータは通常、このレイヤーから取得されます。なぜワイドテーブルと呼ばれるのでしょうか?これは主に、ビジネス関連のすべてのデータがこのレイヤーに収集され、保存され、ビジネス レイヤーがデータを取得しやすくなるためです。このデータ層は通常、DWD 層と DWM 層のデータから取得されます。 実際の計算では、幅の広い表の統計指標をDWDやODSから直接計算すると、計算量が多すぎる、次元が少なすぎるなどの問題が発生します。したがって、一般的な方法は、まず DWM レイヤーで複数の小さな中間テーブルを計算し、次にそれらを DWS ワイド テーブルに結合します。広いと狭いの境界を定義するのは難しいため、DWM レイヤーを削除して DWS レイヤーのみを残し、すべてのデータを DWS に配置することもできます。 3) データアプリケーション層(DAまたはAPP) 4) 次元 (3)問題の拡大 上図のシステムの各部分の実行フローは次のとおりです。 (4)プロジェクトとの組み合わせ 電子商取引 Web サイトのデータ システム設計では、ユーザー アクセス ログ データの例を使用します。 ODS レイヤーでは、両端の開発チームが異なることやその他のさまざまな問題により、ユーザーのアクセス ログが複数のテーブルに分割され、ODS レイヤーにレポートされます。 皆様の使いやすさを考慮して、DWD レイヤーでのユーザー アクセス行動の毎日の表を作成しました。ここでは、PC ウェブページ、H5、ミニプログラム、ネイティブ APP のアクセス ログを 1 つのテーブルに集約し、フィールド名を統一して、データの品質を向上させます。このように、誰でも便利に使える詳細な表があります。 DWM レイヤーでは、DWD レイヤーからビジネス上の関心事の中核となるディメンションを選択し、人、製品、設備、ページ領域のディメンションのみを保持するなどの集計操作を実行します。同様に、多くの DWM 中間テーブルに対してもこれを実行します。 次に、DWS レイヤーで、Web サイト全体でのユーザーの行動データをテーブルにまとめます。こちらは当店の広いテーブルです。このテーブルを使用すると、ほとんどの一般的なビジネス ニーズに迅速に対応できます。 |
>>: データオペレーター(デジタルフルスタックオペレーターの試験を受けるには?業界の見通しは?)
「ストリングミラー」2023年4月のTikTok洗濯石鹸リスト電子商取引データ検索ツール「ストリン...
「私的領域のきめ細かな運用」の根底にある考え方を6000語で解説「きめ細かな操作」という言葉は皆さ...
連東2+1モデルを活用して大手健康産業で人気ブランドを創出する方法ビッグヘルス産業は、医療、健康管理...
WeChatビジネストラフィックルーチンは非常に多く、正確なトラフィックプロモーションを実現する方...
運用データ分析のやり方運用データ分析のやり方【コース概要】運用データ分析方法1.1 運用データ分析の...
第3四半期のパソコンとノートパソコンの販売ランキングが発表されました!コンピューターはLenovo...
WodPess は現在最も人気のあるコンテンツ管理システム (CMS) の 1 つです。強力で操作も...
カンボウェルは正式に中国市場に参入し、第13回広州カスタムホーム展示会でデビューしました。最近、広州...
Excelの年間売上実績レポート、ダイナミックグラフィックチャート、ビジュアルダッシュボードのコピ...
2024年中国6Gコンセプト調査レポート第1章 業界概要1.1 はじめに第6世代移動通信規格である...
データの配当: ビッグデータを活用して洗練されたビジネス運営を推進する方法近年、我が国のデジタル経済...
ワイルドカード証明書は、ワイルドカード SSL 証明書とも呼ばれます。ドメイン名とその下のすべてのサ...
2022 年に知っておくべき 5 つの SEO トレンド画像出典: Tuchong Creativ...
ビッグデータ スマート マーケティング ノートブックからの 15 のマーケティング アイデア「広告費...
初心者でも学べるTikTok SEO:キーワードランキング最適化テクニックTik Tokで動画を撮...