データはどこから来ますか、そしてそのデータとは何ですか?
「データ」自体は空気のように存在し、霞の出現によってのみ私たちの心の中に明確に現れるのです。数百万年前、いや数億年前、人類がこの青い惑星にまだ現れていなかった頃から、データは常に存在し、人類の英知が突然ひらめいて真の意味が与えられるのを待っていました。 この高性能な計算機が登場する以前から、人々は「データ」をより具体的かつ簡単に数えられるようにするために、何万回もの探索を行ってきました。石器や骨片、木の幹など、身の回りにある硬い物体を、質感を彫刻して実物の表情を表現するための媒体として使うのは、自然なスタートのように思えます。 アフリカのウガンダとザイールの国境にあるイシャンゴ漁村で1960年に発掘された数え骨「イシャンゴ骨」は、1万年前の新石器時代初期のイシャンゴ族の作品であり、数え方が刻まれた最古の物体です。古代の部族の人々は、これらのくぼみを使って、日々の取引活動、物資の備蓄、大小の出来事を記録し、基本的な算術計算を行っていました。 イシャンゴ・ボーンズ 今日のコンピュータが普及した社会では、データがさらに重要になっています。ビッグデータの時代に生きる私たちは、データの重要性をすでに認識しています。では、データとは何でしょうか?単純に見える問題が、実は最も複雑な場合がよくあります。 今日、データのより一般的な定義は、多くの場合、コンピューターネイティブの観点からのものです。客観的な物事を観察し、測定し、推測し、統一された基準または非統一された基準に従って結果を記録します。これらのレコードは多かれ少なかれデータです。これらのデータは未処理であると予想され、元のオブジェクトの元の外観と形状を非常によく表します。 データ管理協会 (DAMA) も、データはテキスト、数字、グラフィック、画像、音声、ビデオの形式で事実を表現したものであると考えています。言い換えれば、データは事実を反映する必要があり、それはデータ収集技術とデータ解釈能力によって制限されます。これは理想かもしれません。 データは存在を表すものであり、存在は物質的、精神的を含め人間の意志に左右されるものではありません。物質的なもので言えば、自然界には風、雨、雷、稲妻、人間、動物といった存在が存在します。これらは明確に認識され、デジタル化するのに非常に便利です。精神面では、喜びや悲しみといった人の感情を主観的に何度も計測し、データ化することができます。 多くの場合、データはエンティティに適用されるようであり、ほとんどのデータはエンティティを特徴としています。エンティティを記述する際には体系的なデータが必要になることが多く、単一のデータはあまり一般的ではないようです。エンティティを記述する大量のデータを取得すると、量的な変化から質的な変化が生じることがよくあります。 データの収集は「情報」となり、情報の処理は「知識」となり、知識を適用すると「知恵」が生まれ、データは下位レベルの駆動力となります。これらは密接に結びついて進歩的であり、「DIKW ピラミッド」を形成しています。 データ・情報・知識変換モデル 東洋の知恵を見てみましょう。中国語の「データ」の語源はさておき、その文字通りの意味を見てみましょう。 「数字」には2つの意味があります。 1 つは、データでは、人の年齢や山の高さなどの事実を記録するために数字が使用されることが多いということです。もう 1 つのレベルは、数学的手法を使用して統計を実行し、最終的に、ある集団の平均年齢や、ある集団の山頂の平均高さなどの記録された結果を取得することです。どちらも、数学の平均の概念を適用しています。 「据」という文字を見ると、日常生活における領収書のことだと分かります。領収書は何かが起こったことの証拠です。それらは人間の脳の欠点を補い、時間を固定化します。したがって、「据」は事実です。データは事実のデジタル証拠です。 冒頭で述べたように、デジタル時代の私たちにとって、データは本当に空気のようなもので、もはやその概念について考える必要はありません。 私たちが毎日デジタル化されたコミュニティに住み、活気のあるスマートオフィスや商業エリアで働き、デジタルライフの利便性を享受していると、すべてがとても自然に思えますが、これはモノのインターネット時代の新しいデータエコロジーでもあります。 モノのインターネット時代のデータ よりよく考えることはより良いスタートにつながります。データの概念についての理解をさらに深める必要があります。データに関心のある方は、コメント欄にメッセージを残して、データについてどう考えているかお話しください。 著者: Li Qinghui (Xinba) データ製品の専門家、データ製品チームの責任者。データガバナンス、データ分析、データベース運用に優れている。 Python 書籍「Pandas in Simple Terms」の著者。 この記事はもともと、Everyone is a Product Manager で @一個データ人的私存地 によって公開されました。無断転載禁止 タイトル画像はCC0ライセンスに基づいてUnsplashから引用しています |
<<: 運用データのソース(純粋な乾物!トラフィックソースを分析してプラットフォームの運用結果を改善します)
>>: 運行データ監視(菏沢聯通は運行車両監視プラットフォームを構築し、車両管理レベルと効率を向上)
ゲータレードのエナジードリンクは、1対1のマーケティングを通じてオンラインとオフラインのチャネルを結...
スーパーやコンビニでは主にどんな商品を売っているのでしょうか?どの製品の利益率が高いですか?中国経済...
今後は、HTTPS 暗号化アクセスを実現し、ユーザーのプライバシー情報セキュリティを保護するために、...
文:王志遠 | ID: Z201440 Kimi は最近、k0-math という名前の数学バージョン...
財務データから会社の経営状況を判断すると、そのような会社は宝物です企業を選ぶ際には、その企業の堅牢性...
Apche Tomct サーバーは、無料のオープン ソース Web アプリケーション サーバーです。...
健康茶飲料のための新しいメディアマーケティング戦略茶園の生態学的建設モデルは、茶の品種、栽培、土壌、...
ブランド戦略 4┃バリューマーケティング:ブランド価値を高める6つの秘訣#ブランド戦略# #Yume...
豊島食品の経営状況分析中国上場企業ネットワーク/テキスト1. 会社概要浙江豊島食品有限公司(以下、「...
インターネットマーケティングとは何ですか?ネットワークマーケティングの基本機能インターネット マーケ...
PoweShell は、コマンドライン シェル、スクリプト言語、構成管理フレームワークで構成されるク...
国際旅行業免許の登録と取得ガイド国際旅行業免許の登録と取得ガイドグローバル化が進むにつれ、観光業は国...
登録したドメイン名の有効使用期間を延長し、ドメイン名の正常な運用を確保するためには、ドメイン名の有効...
国内の古い商品が、ネットで新たな有名人になった後も、なぜ人気を保ち続けることができるのでしょうか?長...
どの情報フロー広告が最適ですか?情報爆発の時代において、広告はどこにでもあります。ウェブサイトを閲...