ビッグデータの開発プロセスと仕様ビッグデータの時代において、標準化されたデータ資産管理は、インターネット、ビッグデータ、人工知能、実体経済の深い統合を促進するための必須条件となっています。ビジネス特性に近く、各研究開発段階の要点を考慮した研究開発基準は、研究開発の効率を効果的に向上させ、データ研究開発作業が秩序正しく実行されるようにすることができます。不完全な研究開発プロセスは研究開発の効率を低下させ、コストとリスクを増加させます。 データR&D仕様は、データ開発者と管理者に標準化されたR&Dプロセスガイダンス方法を提供するように設計されており、日常の作業プロセスを簡素化および標準化し、作業効率を向上させ、非効率的で冗長な作業を削減し、企業と政府がビジネスデータの大幅な増加に対処するためにより強力なデータ制御を実現し、それによってより多くの人的および財務的リソースを解放してビジネスイノベーションに集中できるようにすることを目的としています。 日常的なデータ ウェアハウス開発作業の概要と導入を考慮して、データ ウェアハウス開発プロセスは次のポイントに抽象化されます。
各役割の責任 このプロセスはプロジェクト開発を目的としています。プロジェクト開始時には、それぞれの役割の責任を明確にし、複数の役割との調整を行う必要があります。データ開発者は、さまざまな役割を調整し、やり取りする必要があります。
1. オンラインになる前に 01. 要件レビュー 要望伝達と要望検討会議。会議にはデータアナリスト、プロダクトマネージャー、データプロダクトマネージャーが参加しました。クライアントまたはサーバーの追跡が必要かどうか、および追跡する学生が参加する必要があるかどうかを決定します。サービスインターフェース、オンラインクラウドパッケージなどのデータAPIの場合は、サーバー学生も会議に参加する必要があります。会議では、ビジネスの背景と利点、データ モデルと調整、スケジュール、潜在的な危険とリスク ポイントの 3 つの側面に焦点が当てられました。 02. データ調査 データの探索とデータの研究。データ ソースについては、主に、クライアント側トラッキング、サーバー側トラッキング、および DB データの binlog の生成、分析、統合の完全なリンクに精通している必要があります。特に、要件を受け取ったり、主題ドメインモデルを設計する前に、どのようにデータを探索するか(データ調査、データ調査)は、次の点から行うことができます。
データ品質を完全に保証し、問題を適時に検出して損失を阻止し、データ障害のリスクを軽減するために、上記をデータ ガバナンス DQC で設定し、毎日自動的に監視することをお勧めします。 03. パブリックモデル パブリックモデルの設計と開発。 dwd dws dim 一般的なデータ モデル、既存のモデルを再利用できるかどうか、モデルが閉じられているかどうか。特に一部の大企業向けに、需要重視で既存モデルを拡充します。新規ビジネスの場合は、ビジネスプロセス図、CDM、ドメインモデルを整理する必要もあるかもしれません。次元インジケーター マトリックスを整理し、血統の依存関係をモデル化します。同時に、複数のモデルを設計し、次元をどのように表現するか、粒度をどのように変更するか、凝集性が高く結合度が低いか、再利用性があるかなどを検討します。 特に、パブリック モデルはオンライン ビジネス ロジックに結合されてはなりません。 04. アプリケーションモデル アプリケーション層のデータ開発。比較的簡単ですが、油断しないでください。露出の形式、大きさ、粒度、べき等性、キューブが必要かどうかなどを考慮する必要があります。 05. モデルレビュー モデルレビュー。この点を補足すると、開発前にモデルのレビューが必須となります。気づいていなかったモデル設計上の問題をタイムリーに発見して回避できるだけでなく、他の同僚が関連するモデルやビジネスを迅速に理解できるようにもなります。会社が大きくなればなるほど、A および B の役割であっても、より多くのレビューが必要になります。 ちょっとしたエピソード: 職場では、概念やアイデアをモデル化する上で同僚やリーダーとの意見の相違に遭遇することがよくあります。これは、ビジネス上の視点や出発点が異なることが原因である可能性があります。これは仕事では非常に一般的で普通のことです。職場でこれに遭遇しても、心理的な負担を感じる必要はありません。対処方法はいくつかあります:
もちろん、その輪は本当に小さく、いつかまた同僚になれるかどうかはわかりませんので、冷静に対処して最善の解決策を見つけるのが最善です。 06. 標準化された検証 標準化された検証。モデル設計、フィールド名、テーブル名、パフォーマンス、ライフサイクルなどが仕様を満たしているかどうかを再度確認します。 プロジェクトベースの開発に加えて、データ開発者は、過去 6 か月間の販売データやユーザー アクセス データの取得など、製品によって発生する一時的なデータ要件に直面することがよくあります。データ サポートのこの部分では、バックエンドの連携は必要なく、テストも必要ない場合があります。代わりに、明確なデータ指標に基づいて、定期的または不定期にデータレポートを提供します。この部分のデータ開発モデルは比較的単純かつ高速ですが、明確にする必要もあります。
指標の要件には通常、以下の表の合意された項目が含まれます。合意した項目をカスタマイズする必要がある場合は、カスタム形式の列に入力できます。
障害レベルの定義: P0\P1 レベルの問題が指定時間内に解決できない場合、問題の研究開発エンジニアは、問題のコメントに指定時間内に解決できない合理的な理由を説明し、問題の具体的な解決時間を通知して電子メールで説明する必要があります。 著者: CIO Houseの友人 出典: インターネットから収集 CIOホーム www.ciozj.com WeChatパブリックアカウント: imciow |
<<: ショッピングモール運営の主な業務内容(ショッピングモール運営の進め方)
>>: ビッグデータ運用の給料(『採用』年収35万緊急募集!ビッグデータはそんなに有望なのか?)
電子商取引のグローバルブランド代理店運営会社とは?現在、国内の電子商取引プラットフォームの多様化の傾...
建設会社の基本経営方針建設会社の基本経営方針XX建設株式会社は、土木建設業を営む企業です。当社の基本...
ハルビンの赤いソーセージの中で一番美味しいのはどれですか?肉の風味が強く、味も素晴らしいこの4つのレ...
ブランドマーケティングの新たな力: AIGC がクリエイティブマーケティングの新しい戦略の探求を推進...
製品キャンパスプロモーション計画(製品認知度向上)キャンパスプロモーション計画は、製品の認知度を高め...
Xiaomi SU7ブランド: トラフィック、製品、ユーザー、マーケティングに関するインスピレーシ...
山西省太原市で最も優れた専門ブランド企画会社はどれですか?ブランド戦略コンサルティング会社企業の戦略...
「中国農産物産業地帯の電子商取引企業トップ50」が発表され、武昌米、雲南プーアル茶、鄭山小中がトッ...
秦皇島新世紀高校第24回中国語推進週間活動計画「国家共通言語法」をさらに研究し、実施するために、北京...
トラフィックを正確に集めて宣伝する方法マーケティング効果を高め、複数のプラットフォームと複数のアカウ...
デフォルトでは、WodPess はユーザーが投稿やページで PHP コードを実行することを許可しませ...
製品運用に不可欠な5つの品質誰もが自分の主観的な判断を持っていますが、この主観的な判断が仕事に十分に...
午前 2 時、ブラザー B は薄暗い寝室で丸くなり、散らばった配達用の箱や最近の「トロフィー」の残骸...
病院運営管理をどう理解するか? 「病院経営#1」導入 医療分野自体も変革の真っ只中にあり、新たな支払...
江門市人民政府弁公室による江門「月上通」APP企業関連モバイルサービスプラットフォームの宣伝促進作業...