データ管理と分析(データ分析の3つの主要機能:生活上の問題の解決、誤解される可能性の低減、キャリア開発のニーズ)

データ管理と分析(データ分析の3つの主要機能:生活上の問題の解決、誤解される可能性の低減、キャリア開発のニーズ)

データ分析の3つの主な機能:人生の問題を解決する、誤解される可能性を減らす、キャリア開発のニーズを満たす

正直に言うと、データ分析の方法は誰もが知っていますが、分析プロセスにまで高められていません。誰もが心の中で異なる考え方を持っています。したがって、今日の「データ分析の魅力と落とし穴」に関する議論は、あなたの本来の思考レベルに基づいているだけかもしれません。あまり注意を払わない場所が落とし穴となり、あまり良い結果につながらない可能性があります。

今日は主に、私が遭遇した落とし穴を皆さんと共有し、将来同じ状況に遭遇したときにそれらの落とし穴を回避できるようにしたいと思います。

思考を速くするために、まずは簡単な論理問題について考えてみましょう。

宝石店が強盗に遭い、警察は容疑者4人を尋問した。 Aは「それは私じゃない」と言い、Bは「Dがやった」と言い、Cは「Dは盗んでいない」と言い、Dは「盗んだのはBに違いない」と言いました。 4人それぞれが一言ずつ発言しました。誰が盗んだの?

「Aが盗んだんだ」

Aはなぜそれを盗んだのですか?ここで二人の人が言っていることは矛盾しています。一人は「丁はそれを盗んだ」、もう一人は「丁はそれを盗んでいない」です。 2 人のうち 1 人は真実を語っており、他の 2 人は嘘をついているため、どちらかが真実であるはずです。だから、A が「それは私じゃない」と言うと、彼がやったことになり、それで終わりです。

4人のうち1人だけが真実を語り、2人が反対のことを語ったので、1人は真実を語り、1人は嘘をついているに違いありません。私は二人のうちどちらが真実を語り、どちらが嘘をついているかを尋ねません。他の二人が言ったことは嘘に違いないので、それをしたのはAだ。これは論理矛盾の点であり、我々はこれに注意を払わなければなりません。

実際、データ分析でも同じことが言えます。数字を見ると、まず矛盾した数字が目に入ります。 A が大きい場合は B も大きくなるはずですが、現在は A が大きく、B が小さくなっているため、両者の間に矛盾が生じており、注意が必要です。

次に、データ分析で何ができるのかについてお話ししましょう。

  • まず、データ分析は生活から生まれ、誰もが生活の中でデータ分析の問題を解決しています。
  • 第二に、データがさまざまな場所で提示されると、誤解を招く可能性があります。あなたを誤解させるのは、何に基づいているのでしょうか?十分に準備していれば、わかるはずです。
  • 3つ目は、キャリア開発の必要性です。

まず、2つの質問について考えてみましょう(図1を参照)。これら 2 つの質問は非常に古典的であり、デジタル思考で生じる問題でもあります。遭遇するものは違うけれど、考え方は同じだということです。これら 2 つの質問に関して、先生は授業中に 5 分間考える時間を与えてくれました。当時、金融を学んでいた学生たちが最も早く完全に答えました。

(図1)

最初の質問ですが、27元は3人で支払った金額であり、ウェイターが代金を支払った金額なので、この2つは別物です。他に誰がお金を稼いだのですか?ボス。それで、合計費用は3人で27元で、稼いだお金はボスが25元、ウェイターが2元だったので、1元もありませんでした。

2番目の質問は彼の50元についてでした。なぜたった50元だったのですか?この取引を完了するために 50 元が使用されるため、彼が支払う必要があるのはこの 50 元だけです。しかし、彼がこのビジネスから得た利益は4元だったので、20%の割引をしたので、合計は46元になりました。

私たちがあのとき、とても感動したのは、いろいろなことを複雑に考えていたからかもしれません。しかし、分析プロセスでは、複雑なものを単純化し、可能な限り 1 つまたは 2 つの概念で解決する必要があります。ですから、人生で起こる物語や、よく議論される出来事を通して、私たちは次の 3 つのポイントを得られると言えます。

  • まず、矛盾点に注目してください。再チャージの登録と最初の投資への再チャージなどの 2 つの値が手順プロセスである場合、通常はファネル損失プロセスになります。登録数が少ないのにチャージ量が多いなど、途中で逆の傾向が見られる場合は矛盾が生じているため、その矛盾が生じた理由に注目する必要があります。
  • 第二に、概念の変更を避けます。先ほど言った1ドルはどこに行ったのでしょうか?その 1 ドルはそもそも存在しません。どこで見つけられるのでしょうか?実際のところ、その概念は置き換えられました。
  • 3 番目に、複雑なプロセスを単純なものとして考えます。当時の金融学の学生は、出力と入力という 2 つの次元を考慮していたので、すぐに結果を得ることができました。そしてその過程で何度も計算を繰り返すのですが、それでも正しい答えを得ることができません。

これが、私が挙げた例を通して皆さんにお伝えしたいポイントです。データ分析について考えるだけでなく、結論を導き出す必要がある場合もあります。どのように結論を導きますか?

今お話ししたのは、比較的散らばった点です。それでは、私たちの生活の中で実際に起こった事例を使って、全体的な思考プロセスを検討し、完全なレポートや結論を作り上げてみましょう。

テーマは「叔母と小さないとこ」です。

どういう意味ですか?

旧正月のために帰省したとき、叔母が母と話をしに来て、私のいとこが高校入試を受けることになっているが、期末試験の成績があまり良くなかったと母に話しました。たぶんこんな感じだったと思います。彼女もとても心配していて、良い中学校に入れなかったらどうしたらいいかわからないと言っていました。私は部屋にいたのではっきりとは聞こえなかったのですが、外に出ると、母が私に与えた仕事を引き受けました。母は「急いで叔母さんを慰めて、いとこを助けてあげなさい」と言いました。

私たちにとって、それはミッションの目的を受け入れることと同等であり、このミッションの目的とは、次の 2 つの文です。これらは実際には2つの異なるものです。出席した学生たちはどのような視点からそれらを検討するのでしょうか?

もちろん、質問はできますよ。おばさんがそこに座っているから、質問できるんです。彼女の目的は非常に明確だった。彼女は自分の幼い従兄弟が良い高校に入学できるかどうか心配していた。それからあなたのお母さんはあなたに、彼女を慰めて、いとこを助けてほしいと頼みました。このような状況に遭遇したとき、あなたは通常どのような質問をしたり、どのような角度から問題を検討しますか?ここで、私の考えを述べさせてください。

まずはトレンドから分析します。同級生がちょうど環境や業界、競合、つまり従兄弟の学校のランキングについて話していました。彼がすでに主要中学校で成績上位にいる場合、叔母を安心させるためにあなたがすべき最初のことは、「彼がより良い高校に行くことは基本的に問題ではありません。どの高校に行くかというだけの問題です」と言うことです。良いこととより良いこと、良くないこととそれが通過できるかどうか、これらは 2 つの異なる概念です。

また、最近のクラスの雰囲気はどうですか?私のいとこが試験で良い成績をとれなかったのは環境のせいでしょうか?もう一つは、私のいとこの最近の状況についてです。健康上の理由か何かでしょうか。

これらは実際には周辺的な状況です。周辺の状況を見た後、いとこ自身の試験を多面的に分析することができます。たとえば、彼の点数はどのくらいか、科目に対する偏りがあるかどうか、テスト用紙の構造はどのようなものか、目標をどのように設定するかなどです。たとえば、彼がある科目には非常に強いのに、他の科目には非常に弱い場合、それはなぜでしょうか?たとえば、あなたの中国語が非常に下手な場合、言語のどの部分が下手なのでしょうか?

これらは判断を下すのに役立ちます。叔母を慰めることから小さないとこを助けることまでのプロセスは、どのように助けるかということにもっと深く焦点を当てるべきであり、そのためには、さらに細分化されるべきである。例えば、中国語のテストの文章を読むのが苦手な場合はどうすればいいでしょうか?それからそれを分割する必要があります。

ユーザセグメンテーションの検討については、実は応用なので、特に適切ではないかもしれませんが、あくまでもこのような考え方があれば分析するということです。たとえば、あなたのいとこが中国語があまり得意ではない場合、同じクラスで中国語が得意なクラスメートの特徴は何なのか、あるいは彼らはどのように中国語を学んでいるのかを分析しました。たとえば、全員が詩を暗唱したり、新聞や雑誌を読んだりしていますか? あるいは、教師が少人数クラスを開いているのでしょうか?あなたはこれらの状況をはっきりと理解していますか、それともあなたの両親はそれについて知っていますか?これらすべてを理解する必要があります。

また、もともと勉強が得意な生徒に加え、特に成績が急上昇する生徒もいます。学生たちは、短期間で成績を向上させるためにどのような方法を使ったのでしょうか?私のいとこもこの方法を学ぶことができますか?これも観察できます。

次に、ファネル損失とその分析方法についてですが、これは 1 つのパスであるため、ここで議論する必要はありません。しかし、実際には、私たちは考え方を変えることができます。このような垂直的な固定損失ではなく、水平的な構造上の問題である可能性があります。彼の過去の試験での誤り率を分析することができます。彼は今回の試験で良い成績をとれなかったからでしょうか、それともこの科目が昔から苦手だったからでしょうか。

これも理解しておく必要があることです。もう一つは、間違ったセクションにいるということですが、その理由は何ですか?それは時代のせいでしょうか、それとも歴史のせいでしょうか?これは事前に知っておく必要があることです。

最後に、ちょっと試してみます。例えば、一部の学生が成績を早く上げるために使っている勉強法は、彼らにとって適切なのでしょうか?必ず試してみる必要があります。

これら以外にも、もっと多くの次元があるかもしれません。もちろん、データ分析は一種の思考であり、思考を制限することはできません。どれだけ考えても、結局は結論に達します。この結論の全体的な構造は何ですか?あなたは叔母さんにたくさんの質問をしました。結局、彼女にどう答えますか?

私たちの目標は、小さな従兄弟を慰め、助けることだった。これが私たちが最終的に得た結論です。

まず叔母さんを慰めてあげてください。 「叔母さん、心配しないで。学校やクラスの順位から判断すると、私のいとこはどうしているの?」なぜなら、まずは従兄弟の成績がどの程度悪いのかを知るために、彼の順位やテスト結果について総合的に判断する必要があるからです。それは本当にひどいことなのか、それともまだ救われるのか?

常に全員に心理的な準備をさせる必要があります。本当に試験を受ける余裕がなく、コネを見つけるためにお金を使わなければならないのか、それともお金をかけてそれを補って自分で一生懸命勉強できるのか、あるいは実際のところ、あまり深刻に考えず、それは単なる小さな間違いであるのか、などです。

まず全体的な状況について判断を下さなければなりません。先生は彼をどのように特徴づけるでしょうか?彼の状態はどうですか?それから彼は、試験で良い成績をとれなかった主な理由と、先ほど話した事柄のどれが彼に影響を与えたかについて話しました。

つまり、状況や程度を判断するだけでなく、現状を把握し、原因を分析することも検査では必要になります。次に、「私のいとこはこのテスト分野でどのような成績を収めたか、また以前のテストではどのように成績を収めたか?」実際には歴史の要約です。私はいつも成績が悪かったのでしょうか、それとも前回の試験は良かったのに今回はあまり良くなかったのでしょうか?歴史を要約する必要があります。

そして、「彼のクラスの誰かが、主にこれこれの理由で、この分野で優秀な成績を収めました」と言います。その場合、この分野で競合他社がどのようにやっているか、そして参考になるものがあるかどうかを調べる必要がありますか?

最後に、「次の試験までに何ができるのか、目標は何なのか」を述べます。全体的な提案を行い、目標を管理する必要があります。また、叔母さんの期待を高くしすぎてはいけません。期待を管理する必要があります。 「高校進学は問題ない。一中か二中に入っておけばいい」とは言えません。それもうまくいきません。小さな従兄弟に息をつける時間を与えなければなりません。

全体的な答えはこの論理構造を持ちます。タイトルや分析したいものを受け取ってから最終結果が出るまで、これらはプロセス全体の補助的な側面である可能性があります。実際には、支援できる次元はもっと多くあります。実際、データ分析は日常生活で非常に一般的であり、誰もが頻繁に使用しています。

時々発生する可能性のある上記のような問題に加えて、誤解を招きやすいデータがより頻繁に発生します。私はあなたが騙されたとは言いません。それは騙されたとは言えないからです。ただあなたは誤解し、それを信じることを選んだのです。私たちは新聞や雑誌で多くのデータを目にし、それを広め始めることがよくあります。また、今回これを聞いて、絶対に確信が持てないのであれば、簡単にパニックを引き起こす可能性があるので、広めないでほしいと思います。

図2に示すように、これらのデータが新聞や雑誌でどのように記載されているかを見てみましょう。まず第一に、「感情的な雑誌の専門家は、読者のフィードバックを通じて、80%の家族が子供を産んだことを後悔していることを発見しました。」 「一般的に、人々は平均23度が快適だと考えています。」 「今日の交通の危険は日々増大しています。

不完全な統計によると、現在、飛行機事故で亡くなった人の数は20年前の15倍です。2012年の北京の離婚率は39%で、人々は結婚を少し恐れています。全国で第1位であり、2017年には50%を超えると予想されています。"; "学生Aの学期末の5科目の合計得点は450点、学生Bの学期末の5科目の合計得点は460点です。 「生徒Bは生徒Aより優秀です。」

次は最も一般的なものです。「2015年、全国32大都市の平均給与は6,070元でした。」

最後に、軍隊募集のポスターには、「アメリカ海軍の死亡率は1000人中9人であるのに対し、同じ期間のニューヨークの死亡率は1000人中16人である。したがって、軍隊に入隊する方が安全であり、誰もが入隊することを奨励される」と書かれていた。

これらはすべて新聞や雑誌からの抜粋、または日常生活でよく登場する事柄です。騙されているのではなく、騙されているように感じるのはなぜでしょうか?この章を終えた後にこの質問に答えます。あなたもそれについて考えることができます。皆さんのほとんどは、何が問題なのかすでにご存知かもしれません。

(図2)

私たちはすでに人生において多くの「詐欺」や誤解を招くようなことを発見してきましたが、それでもなぜ統計をとる必要があるのでしょうか?ハーバード大学統計学部の創設者モステラー氏はかつて、 「統計を使うのは簡単だが、統計を使わずに人々を騙すのはもっと簡単だ」と語った。

データ分析とは何ですか?

データ分析とは、収集された大量の一次データや二次データを適切な統計手法を用いて分析し、データの機能を最大限に引き出し、データの役割を十分に発揮させることを指します。有用な情報を抽出し、結論を導き出すために、データを詳細に調査して要約するプロセス。そこには 2 つの重要な情報が含まれています。1つ目は、役立つ情報です。次に、結論を出します。

まずは、役に立つ情報です。データに関する有用な情報とは何ですか?

主に 3 つの側面があります:数字;比率;グラフィック。さまざまな種類がありますが、私たちが最も頻繁に接触するのは、この 3 つの種類です。

算術平均、最頻値、中央値など、私たちは日常生活の中でこれらに頻繁に触れます。平均値は誰もが知っていますが、最頻値は配列内で最も多く出現する数値であり、中央値はデータ グループの中央にある数値です。

これら 3 つの数字のうち、過半数だけが真の数字であり、数字自体の特性は変わりません。中央値は、配列内に偶数がある場合に計算する必要があるため、半偽数です。 2 度目に計算する必要がある限り、人為的な操作ミスや何らかの形のエラーが発生するため、中央値は半偽数と呼ばれます。算術平均は、二次計算を実行する必要があり、計算プロセスで予期しない落とし穴が発生することが多いため、実際には誤った数値です。

図3に示すように、3月の投資家は10名、投資総額は10,000、平均顧客単価は1,000でした。 4月には投資家数が増加し、投資額は2倍、平均顧客単価は10倍になった。データアナリストであれば、この数字を初めて見たとき、興奮のあまり倒れてしまうかもしれません。本当にこのように報告しますか?

(図3)

そこに書かれているのは平均客単価です。 「平均」という言葉が出てくるときは、数字そのもの、つまり外れ値があるかどうかを見る必要があります。遡ってみると、4月にこれだけの投資額の投資家が20人いたにもかかわらず、そのうちの1人が自ら15万元を投資していたことがわかります。

計算してみると、平均的な顧客の注文数はわずか 2,500 件です。その結果、これを報告すると、上司は「10 倍の成長は良いことだ。来月は平均顧客注文数を 12,000 にしましょう」と言います。すると、あなたは困難な立場に立たされることになりますが、実際の注文数はたったの 2,500 個です。おそらく、あなたのせいで部署全体が困難な立場に追い込まれているのでしょう。

もし本当にそのような数字が現れて、遡る必要があるなら、穴があればそれを埋めなければならないと言うのです。この穴をどうやって埋めればいいのでしょうか?まず、配列全体に外れ値があるかどうかを確認する必要があります。外れ値がある場合は平均値は使用できません。結果を見る前に外れ値を除去する必要があります。

第二に、配列内の分散を調べる必要があるのは当然ですが、実際の作業では、さらに多くのデータ概念を導入することはお勧めしません。結論を導き出せるということは、使用するツールがより複雑で高度なものであるほど良いということではなく、より速くより正確に問題を特定し、結論を導き出せるほど良いということなのです。

したがって、異常があるかどうかを確認するには、最大値、最小値、中央値を直接使用することをお勧めします。これは、分散を計算したり、標準偏差の概念を理解したりするよりも便利です。したがって、結論を導き出すには、誰もが理解できるものを使用することをお勧めします。

人々は絶対値を見るよりもパーセンテージを使うことが多いです。誰もが「前月比ではどうなっているのか、前年比ではどうなっているのか」と言うでしょう。

まず、前年比と前月比の比較を概念的に区別してみましょう。前年比とは、例えば2015年3月と2016年3月など、同じ時点の比較を指します。前月比較とは、ある時点との比較を指します。たとえば、2015 年 3 月と 2015 年 4 月は前後関係にあります。

今月と先月の比率を意味するものではありません。これが価値であり、落とし穴はありません。しかし、それはまだ存在しています。もう一つ穴を掘りましょう。

図 4 を参照してください。これはシミュレーションされた投資額です。これは、2015 年 2 月 1 日から 7 日までと、2016 年 2 月 1 日から 7 日までの投資額の分布です。上司が数字を見るとき、上司はあなたを見て、あなたはグラフを見ます。そうなると、穴があるのだから埋めるべきです。

特別な日付ノードは、単純に絶対日付に基づいて比較することはできません。比較の基準としては、特別な日付自体を使用するのが最適です。例えば、「春節前の1週間の投資額の比較」など。このとき、特に重要なのは、土曜と日曜の状況を区別し、ボラティリティを見ると、周期的な変動があるかどうかです。土曜と日曜は周期的な変動ですが、このタイプは特別な日に節目となる変動なので、この2つを見たりグラフにしたりするときには細心の注意を払わないと、トラブルに巻き込まれる可能性があります。

(図4)

縦棒グラフ、円グラフ、折れ線グラフ、棒グラフなど、これらは誰もがよく知っていて、日常生活で頻繁に使用されます。これらのグラフの多くは、組み合わせチャートの形式で表示されます。ここで区別すべき唯一の点は、縦棒グラフと棒グラフが混在して使用されていることです。おそらく、棒グラフは主にカテゴリを区別するために使用され、縦棒グラフは期間を区別する傾向があります。

したがって、棒グラフの主な特徴は、任意の軸の位置を変更できることですが、これは通常、縦棒グラフでは不可能です。グラフィックは実は非常に誤解を招きやすいものです。なぜなら、人々はグラフィックを初めて見たときに簡単に影響を受けてしまうからです。グラフィックスの落とし穴はどこにあるのか見てみましょう。図 5 に示すように、図だけを見てどのような結論を導き出すことができるでしょうか?

(図5)

まずは上部から見てみましょう。実は、数値軸が違うだけなのです。したがって、グラフを見るとき、特に 2 か月間のグラフを比較するときは、まず全体像を把握する必要があります。ベースラインは非常に重要です。一方は 0 から始まり、もう一方は 400 から始まるので、400 から始まる方の変動は間違いなく大きくなります。

下の部分を見ると、成長は同じように見えますが、こちらの方が鮮明です。実際、これら 2 つは同じ意味を表します。1 つは増加分であり、もう 1 つは基本量であり、2 つのサイクルの差であるためです。ただし、一方は明らかに増加しており、もう一方はゆっくりと増加しているように見えます。これは落とし穴ではありませんが、自分の視点をグラフィックでどのように表現するか、また、この問題の状況や傾向を表現するためにどのようなグラフィックを使用するかについてです。

先ほど、有用な情報は数字であると言いましたが、数字には実数、半偽数、偽数の 3 種類があります。さて、皆さんに聞きたいのですが、偽の数字がどの数字であるかまだ覚えていますか?平均、平均とは何を考慮する必要がありますか?外れ値を考慮してください。

次に結論を述べます。先ほどの情報から判断した後、どのような方法で結論を出せばいいのでしょうか? 4 つの方法について説明します:比較;分割;次元の増加と次元の削減。仮説

ここでは比較と分割についてのみ説明します。なぜ?

次元増加と次元削減は、主に実際に必要なときに判断を下すのを支援するために使用されますが、仮説は結果に基づいて、または結果が得られない場合に作成する必要があるものだからです。これは比較的抽象的であり、比較と分割は最も頻繁に使用される 2 つの方法です。

(1)比較

コントラストの定義については、ここで学ぶ学生はコントラストに精通しており、頻繁に使用するはずなので、あまり説明する必要はありませんが、注意が必要な 4 つの点を強調したいと思います。

  1. 比較対象は一貫している必要があります。どういう意味ですか?つまり、2 つの値を比較する場合、基本的なオブジェクトは同じです。私たちが今読んだ新聞や雑誌の中には、比較対象が一貫していないために誤解を招くものがあることを思い出してください。
  2. 時間属性は一貫している必要があります。たとえば、2つの会社があります。ある会社では、「離職率は 12% です」と言われます。大まかな見当はついているのに、次の会社に問い合わせると、「あの会社には行かないほうがいい。12%は良くない。ここはとても安定している。うちの会社はたったの4%だ」と言われる。そして、「悪くないね、じゃあ彼らの会社に行って」と言います。聞き返してみたところ、1つは年間契約で、もう1つは月間契約であることがわかりました。これは大きな落とし穴でした。したがって、時間属性が一貫しているかどうかを確認する必要があります。もちろん、今の数字は単なる一例です。月間と年間の数字の差はそれほど小さくはないはずです。
  3. 定義と計算方法は一貫しています。これは私たちが本当に細心の注意を払う必要があることです。以前、レポートを作成していたときに、対象グループが若者だったときに、これに遭遇したことがあります。世界保健機関は、若者を 14 歳から 44 歳までと定義しています。国家統計局は、若者を 15 歳から 34 歳までと定義しています。したがって、ここでも定義が重要です。あなたが話している若者と私が話している若者はまったく同じグループではありませんので、この点で定義が非常に重要です。
  4. データ ソースは一貫している必要があります。これは先ほどの定義と同じです。あなたは国家統計局から数字を入手し、私は世界保健機関から数字を入手します。たぶん、私たちの数字は決して一致しないでしょう。つまり、あなたの番号は正しい番号で、私の番号も正しい番号ですが、私たちの番号は一致しません。したがって、これはデータ ソースに関する質問であり、非常に明確にする必要があります。

(2)分割

分割は、問題のあるフィールドをすばやく見つけるために使用されます。例えば、取引金額が異常に変動している場合は、取引金額フィールドを取引ユーザー数×平均注文額に分割する必要があります。取引を完了したユーザーは、訪問回数とコンバージョン率でさらに細分化されます。 A に問題がある場合、B にも問題がありますか? BとCのどちらが間違っていますか? Bの下のDとEのうち間違っているのはどれですか?

分割の目的は、異常な問題のある数字をできるだけ早く見つけることです。下から上への消去法を使用することもできます。つまり、何か問題が発生した場合でも、すぐに解決できるということです。分割とは、できるだけ早く解決する必要があるモジュールを見つけることです。それはリンクされたプロセスです。それぞれの値の変化には理由がある可能性があり、その理由はすぐに見つけることができます。

したがって、これは定期的に確立する必要がある論理的な問題です。ここで別途、分割することが本当に重要であるということをお伝えしたいと思います。この宿題は、問題が発生したときだけ探すのではなく、問題が発生したときに問題を見つけられるように定期的に行う必要があります。

これは以前新聞や雑誌で目にした問題です。戻って、これらの数字がなぜ私たちを誤解させたのかを調べてみましょう。

  1. 80%の家族が子供を産んだことを後悔していると答えた。先ほど私が言ったのは、統計オブジェクトは一貫していなければならないということです。なぜ矛盾があるのでしょうか?あなたが出した結論は、感情雑誌の専門家の読者からのフィードバックに基づいています。たとえば、感情の専門家の記事を読むのが好きで、彼ら全員が多かれ少なかれ感情的な問題を抱えているとしたら、彼らの家族の 80% が子供を産んだことを後悔しているというのは受け入れられることです。なぜなら、一般的に問題を抱えている人は誰でもそのことについて不満を言うからです。
  2. これはまだ平均値の問題です。より正確な表現は「身体感覚」でしょう。 23 度は平均ではなく、快適に感じるでしょう。なぜなら、足と頭に氷を乗せて火鉢の上に立つと、平均温度も 23 度になりますが、それでは非常に不快だからです。したがって、「平均」という言葉は注意して使用する必要があります。
  3. 今日、飛行機事故で亡くなった人の数は20年前の15倍です。怖いように思えるかもしれませんが、これは絶対値を比較しているのです。時間的に見て、20年前に飛行機に乗った人は何人いたでしょうか?飛行機は数機しかありませんよね?実際のところ、これは考慮する必要がある時間の問題です。このように表現するのであれば、絶対値で直接比較するのではなく、その年に飛行機に乗った人数と亡くなった人数と、現在飛行機に乗った人数と亡くなった人数の比率、つまりパーセンテージで表すべきです。
  4. 離婚率について。北京の離婚率は2010年に39%で、2012年には50%を超えると予想されています。もう終わりでしょうか?私はそれに注意を払わなかった。いずれにせよ、この数字は数か月にわたって否定され、最終的な結論は統計手法に問題があったというものでした。結婚と離婚の比率は39%です。おそらく、より科学的な計算方法は、離婚率を計算するので、離婚率は人口に基づいて計算されるため、総人口に対する離婚の割合です。
  5. 学生Aの学期末の5科目の合計得点は450点、学生Bの学期末の5科目の合計得点は460点です。学生 B は学生 A よりも優れていると結論付けることができます。これは実際には定義の問題、つまり優秀さをどのように判断するかという問題です。優秀とは成績のことを指すという主張は大きな問題ではないかもしれませんが、例えば特別な才能を持った生徒がいる場合、その生徒が自分の専門分野で優れているとも言えます。これが、優秀さの定義が異なる理由です。
  6. 言うまでもなく、毎年平均給与が発表されるたびに、皆がジャック・マーに騙されて自分たちが「平均化」されていると文句を言う。
  7. 海軍の死亡率に関する質問は、先ほど述べた統計対象に関する質問と同じです。海軍の死亡率は千人あたり0.9人だが、亡くなったのは皆健康な若者と中年層だ。同時期のニューヨークの死亡率は1,000人中16人であったが、これは交通事故、病気、老齢などさまざまな理由によるものと考えられる。統計対象が異なるため、「軍隊に入る方が安全だ」というあなたの結論は誤解を招きやすく、誰も信じないでしょう。

もちろん、データ分析が魔法のようというわけではありませんが、データ分析に対してこのような考え方を持っていれば、結論を導き出したりフィードバックをしたりするときに、他の人を誤解させたり、他の人に誤解されたりすることがなくなるのと同じように、仕事がより便利になります。キャリア開発のニーズと比較すると、最初の 2 つの部分はほとんど基礎です。データ分析はツールではなく、頻繁に培う必要があるスキルにすぎないからです。

キャリア開発の必要性について話したとき、私はそれを特に議論の対象にしました。私たちが頻繁に遭遇するのは、データの必要性です。多くの学生はデータベースに直接アクセスできないため、データを提供する人に多くの要求をする可能性があり、その結果、多くの通信コストが発生し、導き出された結論が学生が必要とするものではない可能性があります。実際、データを提出する必要があるのは、Word から Excel に変換するプロセスです。

次に、いくつかのポイントについてお話しします。完全にカバーできるとは言えませんが、これらの点は見落とされがちなので注意が必要です。この文を Word で分割する方法、定義方法、目的、制限事項は何ですか?

多くの学生は、「データ分析では目的が最優先ではないでしょうか。目的がなければ、どうやってデータを改善できるのでしょうか。」と質問します。

しかし、何かを分析したいときに、漠然としていて、何をしているのかよくわからないことがあります。しかし、私はただ多くの人がこの考えを持っていることを知りたいだけです。この文を分割して定義すると、目的がどんどん明確になるので、中心となる目的を 3 番目の部分に置きます。そして、3 番目の部分では、なぜこの数字に言及するのかが非常に明確になります。

簡単な例を挙げると、これは予備的なアイデアです。 「最近短期投資をしたユーザーの再投資行動を知りたい」と語った。

たぶん、このことを知りたいと言うのと同じくらい簡単なことなのでしょう。それから私たちはそれを分割しました。その中心となる分野は、形容詞の後の主語です。再投資行動を確認したい。どのような再投資行動がその原因なのでしょうか?最近、短期製品を購入し、投資行動を起こしたユーザーの再投資行動です。次に、単語のテキスト式がフィールドに変換され、これが分割の最初のステップです。

次に、それを定義する必要があります、再投資とは何ですか?

  1. 再投資は、単一の投資が期限切れになった後に再投資を意味しますか、それともユーザーが2度目に投資していることを意味しますか?これを区別する必要があります。
  2. 「再投資」と「行動」がコアです。行動は品質または量を指しますか?私が望むのは、再投資額の割合または再投資の数ですか?何を分析しようとしていますか?この投資行動は正確には何ですか?

その後、近い将来になります。近い将来は1か月、3か月、または半年ですか?成熟後に単一の投資を再投資している場合、あなたの短期的な投資は投資目標に関連しています。過去1か月以内にある場合、単一の投資が成熟したときに再び投資する必要があるかどうかについては、これを慎重に検討する必要があります。

それから短いマークがあります。短い入札は15日か30日ですか?どのように定義しますか?このパッケージには初心者入札が含まれていませんか?

その後、投資行動があります。あなたが上で言ったことは、最近短期投資があったということだからです。短期投資に投資するのは初めてですか、それとも最近投資がありましたか?

最後に、ユーザーがいます。ユーザーも簡単に定義できるようです。初めてのユーザーですか、それともリピートユーザーですか?もちろん、再投資されたユーザーはここに存在するべきではありませんが、ターゲットが明確でなければならないため、ユーザー自身を定義する必要があります。

これらすべてを整理したときにのみ、あなたはあなたの目的が何であり、どのような結論を引き出すかを知るでしょう。この文をそのようなコアコンテンツと定義に分解すると、この数字からどのような結論が得られるかがわかり、目的が何であるかがわかります。数字を提案する前に何度も、「あなたが望む数字についてはっきりと考えましたか?」と尋ねます。実際、これははっきりと考えるプロセスです。

制限に関しては、いくつかの条件は特に明確である必要があります。たとえば、短い入札パッケージには初心者入札は含まれていません。これは制限です。あなたが知りたい再投資の動作が、彼が以前に再投資したかどうかである場合、制限条件は、彼が何回再投資したか、彼がどれだけのお金を再投資したかについて言及することなく、彼が再投資をしたかどうかを判断する必要があります。

したがって、データ要件が提起されたとき、私はいくつかの提案をしました。非必須フィールドが少ないほど良いです。 1人が分析できるフィールドは限られているため、1人が7、8、9、または10語をカバーすることは不可能です。真ん中にあまりにも多くの要因があるため、2つの単語間の関係を判断することは困難です。コアコンテンツに集中するために2つまたは3つの単語を用意するのが最善です。

実際、これらは実際の作業に関与する可能性のある内容の一部です。今日、私は合計で3つの側面を共有しました:

  1. データ分析が使用される生活のいくつかの状況。
  2. いくつかの数字はあなたを誤解させます。
  3. 実用的な観点から、データ要件を上げる際に注意を払うためのいくつかのポイントについて話しましょう。

著者:ppmoney、パブリックアカウント:gupo'sthings(id:gupo520)

この記事はもともと@Ppmoneyがプロダクトマネージャーに@Ppmoneyによって公開されました。無断転載禁止

タイトル画像はCC0ライセンスに基づいてUnsplashから引用しています

<<:  データ駆動型経営(データ駆動型の思考は、ブランドが効率的な意思決定を行うのにどのように役立つのでしょうか?)

>>:  データ管理(通道意思決定|莫祖全:データ管理レポートを標準化すべき理由(2021.11.8))

推薦する

ネットストア運営に欠かせないコンテンツとは? (59. コンテンツマーケティングを誤解するとオンラインストアの運営が台無しになる)

59. コンテンツマーケティングを誤解するとオンラインストアの運営が台無しになる現在、オンラインス...

Rank Mathプラグインについてはどうですか? Rank Mathプラグインの機能

Rnk Mthプラグインはどうですか? Rnk Mth は、WodPess の SEO プラグイン ...

事業運営状況には何が含まれますか? (「月曜レビュー」業務運営上の課題を解決する4つのステップ)

「月曜レビュー」経営課題を解決する4つのステップ毎週月曜日はOSESの固定プロジェクト報告(共有)...

情報フロー広告を検索する(情報フロー広告の素材を探す方法です。適切な素材を見つけるのは簡単です)

情報フロー広告に適したクリエイティブを見つける方法を説明します。情報流通広告資材は情報流通プロモーシ...

後朗ブランド企画(後朗企画チームとの対話:スクリーンスイープの過程でさまざまな理解が生まれるのは興味深いプロセスです)

「ホウラン」の企画チームとの対話:スクリーンスイープの過程で異なる理解が現れるというのは興味深いプ...

高級ブランドの世界販売台数(2023年の中国高級車ブランド販売台数発表:BBAが確実にトップ)

2023年の中国高級車ブランド販売が発表:BBAは確実にトップ陣営に入る最近、メルセデス・ベンツ、...

パーティションブランドランキング(3大パーティションブランドを推奨)

推奨される3つの主要なパーティションブランド記事を聞く: 読みやすくするトップ10パーティションブ...

データオペレーションインターンシップ(Daokou Jinke)

ダオコウ・ジンケ北京道口金科テクノロジー株式会社について北京道口金科科技有限公司は2018年に設立さ...

TOB顧客のプライベートドメイン運用の静かな影響 - WeChatモーメンツ運用

出典: Cici Notes混乱した思考を捨て、秩序あるコンテンツを作りましょう。前回のSOPに関す...

FTB ログインなしで WordPress をアップグレードするにはどうすればいいですか?

WodPess に関するチュートリアルはこれまでにも数多く紹介されてきました。この点に関心のあるウェ...

美瑞ブランド企画株式会社(南洋風ブランドをどうデザインするか?)

南洋風ブランドをデザインするには?ブランドコアマレーシア文化のハイライト-東南アジアの特産食品ブラン...

情報フロー広告最適化は何をしますか? (情報フロー広告の最適化ロジックとは?データ分析のやり方は?入札戦略とは?)

情報フロー広告の最適化ロジックとは?データ分析はどのように行うのですか?入札戦略は何ですか?多くの友...

運用のために確認する必要があるデータは何ですか? (ついに、電子商取引業務におけるビッグデータ分析指標トップ10を解説してくれた人がいた)

ついに誰かが電子商取引業務におけるビッグデータ分析のトップ10指標を説明してくれた具体的な計算方法や...

製品マネージャー製品運用(To B 企業で製品運用チームをどのように構成するか)

To B 企業内で製品運用チームを構成するにはどうすればよいでしょうか? B2B企業では、製品運用...