手があれば初心者でもデータ分析ができる

手があれば初心者でもデータ分析ができる
データ分析に関しては、多くの人が過度に複雑なモデルやツールに夢中になり、核心部分を無視する傾向があります。
「迷信を打ち破る」ために、私は分かりやすく実践的なベビーシッターガイドを書くことにしました。

量子力学ではなくデータサイエンス
言語やツールがどれだけ洗練されていても、データ分析ではデータの取得、データのクリーニング、データの理解という3つのポイントを避けることはできません。
ホットな検索は非実用的で理解しがたいものが多いので難しいです。
次に、ケースを使用してこの記事を正式に開始してみましょう。
 案例背景:你需要为景区设计文创产品,但不清楚哪类文创产品受欢迎。你想通过分析文创产品的类型、价格和销量等数据来获取灵感。比如,哪些类型的文创产品卖得最好?价格与销量之间是否存在相关性? 数据需求:包含名称、分类、价格、销量、用途、人群、材质、风格。销量排名前100个商品数据,

生データを抽出し、無効な要件を削減します。
私たちは、プラットフォームがデータを取得するのが遅すぎる、または開発に多くの困難があるのではないかと常に感じていますが、実際には、プラットフォームは役に立たないデータを要求しすぎています。
リクエストをするときは、自分自身に何度も問いかけてください。それは本当に必要ですか?代替方法はありますか?
次に、オリジナルデータ、そしてオリジナルデータの少ないものを要求してください。
 
データ抽出の範囲を制御することで、冗長な情報を処理するための計算および手作業の負担を軽減できます。そして元のデータは簡単に結合できますが、結果データは抽出が複雑なだけでなく、処理も困難です
データを取得した後、生のデータは乱雑であることが多いため、急いでデータを分析しないでください。
データがクリーンアップされていない場合、その後の分析結果が歪んだり間違ったりする可能性があります。データが「クリーン」な場合にのみ、分析ツールとモデルが機能します。
次に、データを「読み取り可能」かつ「使用可能」にするためにデータをクリーンアップする方法を見てみましょう。

理解できるまで掃除すれば、機械も理解できるようになります
ツールレベルでは、Feishu の多次元テーブルを使用することをお勧めします。これにより、後続のグラフィックスがより便利になります。
1. データのクリーニング
まず、 「故宮」、「文化と創造」、「公式旗艦店」などの無駄なキーワードを削除します。
クリーニング後は、読み取りエクスペリエンスが向上するだけでなく、機械がデータを処理するために必要な計算能力も削減されます。
必要に応じて、空の値を埋めたり、ラベル形式を統一したりして、データが明確で標準化されていることを確認するなど、他のクリーニング方法を追加できます。
2. データ分類
2-1.特徴抽出
2 番目のステップでは、貴重な特徴を抽出する必要があります。たとえば、商品名に祭り、目的、人々のグループなどが含まれる場合です。
最も簡単な方法は、スマート ラベリングに Feishu のフィールド ショートカットを使用することですが、標準化しやすいこのタイプのデータの場合は、関数抽出の方が適しています。
たとえば、 REGEXEXTRACTALL関数:
 REGEXEXTRACTALL( [商品标题], "教师节礼物|生日礼物|乔迁礼物|儿童节礼物|结婚礼物|创意礼物|伴手礼" )

この機能は、商品タイトルから一致するギフトタイプを抽出し、「目的タグ」に変換します。

タグを抽出した後は、必ず関連キーワードを再度クリアしてください。
2-2.数値による分類
カテゴリの価格分布を分析する場合、価格データがまばらだと問題を効果的に特定できません。
しかし、価格を範囲に絞り込むと、データが集中し、分析しやすくなります。
 IFS( [商品价格] <= 50 , "50以下" ,  [商品价格] <= 100 , "100以下" ,  [商品价格] <= 200 , "200以下" ,  [商品价格] <= 500 , "500以下" ,  [商品价格] <= 10000 , "500以上" )
AI以外にも、 IFS関数を使うとより便利です。価格マッチング範囲内の値を対応する間隔に分類します。
クリーニングと分類を通じて、人間と機械の両方が理解できるようになり、分析の次のステップに進むことができます。

分析: ネジを締めて、ロケットを作らない

ヘルプ!上記の原文は24,000回閲覧されています
分析によく使用されるチャートは、トレンド チャート、円グラフ、棒グラフ、バー チャート、ワード クラウドです。問題の 80% は処理できるので、ポーターの 5 つの力について心配する必要はありません...
トレンドの変動により問題をより早く発見することができ、割合と変化により重要な問題に焦点を当てることができます。複合チャートのクロス分析とドリルダウン分析により、問題をさらに特定できます。
分析に戻りましょう。
01. 文化・創造製品の種類、販売量、価格
円グラフを分析すると、売上高シェアとカテゴリーシェアがほぼ一致していることがわかります。
しかし、「その他」のカテゴリーでは紙袋の販売数が2万個であり、データが歪んでいた。
そこで、紙袋商品を除外し、装飾品、文房具、食器など主要カテゴリーの売上を再度分析しました
カテゴリーは主に装飾品(29.4%)、文房具(22.6%)、食器(20.17%)に集中しており、カテゴリー数が多いものが売れ筋でもある。そのうち、平均価格が最も高かったのは食器類(210元)で、最も低かったのは文房具類(76元)だった。
02. 販売量と価格の関係

後続の分析のために製品をカテゴリ別に絞り込みます。右上隅のボタンに気づきましたか? Feishu ドキュメントによって生成されたチャートはインテリジェントに分析できるため、効率をさらに向上させることができます。
洞察

さまざまな商品カテゴリーの中で、調理器具は最も高い価格(210)ですが、販売量は最も高くありません(877)。

ジュエリー製品(154)は価格が中程度で、販売量(506)は比較的低い。

分析する

価格と販売量の相関関係は弱い。食器を例に挙げてみましょう。価格は比較的高いですが、販売量は相当なものです。ジュエリーの価格は中程度ですが、販売量は比較的少ないです。これは、価格が販売量を決定する唯一の要因ではなく、製品の機能、市場での位置付けなどによって影響を受ける可能性があることを示しています。
03. 使用状況、人口、材質が価格と売上に与える影響

洞察:

教師の日ギフトの販売数量は1,012個となり、全用途中最多となった。

こどもの日のギフトの価格はたったの35と比較的安価です。

分析:

使用量、価格、販売量の間には一定の相関関係があります。例えば、より高価な中秋節のギフトの販売数は 700 個であるのに対し、より安価な子供の日のギフトの販売数は 400 個でした。教師の日のギフトは最も高価ではありませんが、市場の需要に合致しているか、プロモーションがより効果的であるため、売上が目立っています。

 

全体的に、価格と販売量は正の相関関係にあり、価格の高い製品は比較的販売量が多い傾向があります。

使用状況をセグメント化すると、価格と販売量の相関関係についての結論は異なります。同じ方法を使用して、群衆、素材、創造性の影響を検証できます。

タグに基づいて生成されたワードクラウドには非常に奇妙で創造的な部分があり、非標準のデータは直接抽出に適していないことも示しています。

最後のステップは、提案を出力することです。分析には意見や提案が必要です。

観点:

1) 装飾品、文具、食器類が好調で、大量生産され、販売も好調で、装飾品の販売量が29.4%と最も多かった。

2) 販売量と価格の関係は複雑で、全体的に強い相関関係はありません。調理器具などの一部の高価値製品はかなりの売上を上げていますが、他のカテゴリでは相関特性は見られません。

3) 祭りの影響が顕著:教師の日の販売(1,012個)が明らかにリードし、より高価な中秋節の贈り物も好調でした(700個)。特定の祭りは売上に大きな影響を与えます。

4) 群衆とクリエイティブのデータは参考としてあまり意味がありません。SEO ではタイトルのターゲット ユーザーが部分的にしか明確に定義されていないため、クリエイティブのワード クラウドは比較的混沌としています。ターゲットを絞った検索を行うには、カテゴリ内の上位 5 つの製品を選択することをお勧めします

 

提案:

1)カスタマイズのコストを考慮すると、装飾と文房具のカテゴリに重点を置くことをお勧めします。

2) 単語の出現頻度に基づき、季節や休日の変動による売上への影響を軽減するために、旅行用バッグや室内装飾品など、幅広い層を対象とした日常的な製品のデザインを優先することが推奨されます。

3) さらに、クリスマス冷蔵庫マグネットなど、休日をテーマにした低コストで生産が速い製品を開発することもできます。



やっと
ビジネスの量が一定レベルに達するまでは、複雑な用語にあまり力を入れないでください。高いところに立つということは必ずしも遠くまで見渡せるということではありません。
そのレベルに達したら、専任のデータアナリストも雇ってこの作業を行うことになると思います。

<<:  TaobaoとWeChat Payが仲良くなってAlipayが嫉妬?

>>:  借金とギャンブルで、広正眼科は「資本迷路」に深く陥っている

推薦する

車両運行データ分析(車両運行軌跡に基づくビッグデータ分析と活用)

車両運行軌跡に基づくビッグデータ分析と応用時代の進歩に伴い、物流業界の急速な発展により貨物の需要が増...

AI ブランド マーケティング (メタバースと AI がブランド マーケティングを完全なインテリジェンスの時代へと推進)

メタバースとAIがブランドマーケティングを完全なインテリジェンスの時代へと導く最近、2024 T-E...

オムニメディア マーケティング スキル (短い動画を通じてオムニメディア マーケティングを実現し、収益を迅速に増やす方法)

短い動画を通じてオムニメディアマーケティングを実現し、収益を急速に増やすにはどうすればよいでしょうか...

化粧品ブランドの売上データ(CASSがスキンケア消費動向レポートを発表:科学的なスキンケア需要は多様化)

社会科学アカデミーはスキンケア製品の消費動向に関する報告書を発表:科学的なスキンケアのニーズはますま...

SEO 最適化ウェブサイト (5 つの無料自習 SEO テクノロジー ウェブサイトを共有し、SEO を素早く学習)

SEOを素早く学ぶための無料の自習SEO技術ウェブサイト5つを紹介SEO を無料で学ぶ場合、検討す...

国有資本運営予算支出には何が含まれますか? (資金効率を向上!国有資本運用予算は「全額カバー」を重視)

資本効率を向上!国有資本運営予算は「全面カバー」を重視北京の記者、劉玉如と徐雲倩が伝えた。国有資産を...

これは私が今まで見た中で最高のユーザー成長分析モデルです

出典: 地に足のついた教師チェンデータ主導の成長は多くの企業がデータアナリストに求めていることですが...

美容業界チェーンブランドランキング(シルクドメインヘアケアサロンが「2023年フォーブス中国美容業界トップ100ブランド」を受賞)

シルクドメインヘアケアサロンが「フォーブス誌2023年中国ビューティーブランドトップ100」を受賞出...

インターネット製品運用履歴書(インターネット製品運用履歴書を書く際に考慮すべき点は何ですか?)

インターネット製品運用の履歴書を書く際に考慮すべき点は何ですか? Huanzhu 履歴書 haunz...

Yandex ウェブサイトの最適化 (Yandex SEO を 1 つの記事で理解: ロシアの対外貿易はここから始まります)

Yandex SEO を 1 つの記事で理解する: ロシアの対外貿易はここから始まりますYande...

無料の WordPress プラグインとプレミアム WordPress プラグインの違いは何ですか?

WodPess プラグインは、Web サイトの構築に不可欠なツールです。プラグインごとに、セキュリテ...

手術の内容は何ですか? (記事では操作が何なのかを説明しています。)

1つの記事で操作とは何かがわかります。卒業後、後輩に会うときはこうやって挨拶したらいいのにって思っ...

酒類ブランド管理(酒類の表紙|競争次元のアップグレード:酒類ブランドは徐々に製品のスリム化から多角化管理へ移行)

ワインの表紙|競争次元のアップグレード:酒類ブランドは徐々に製品のスリム化から運営の多様化へ移行カバ...

ゲームコンテンツの操作(ゲームをうまく操作するには?)

良いゲームを運営するには?データ分析は、ゲーム運営やプロモーションのプロセスにおいて最も専門的な部分...

製品プロモーション事例(広州黄埔低高度経済は「革新的」であり、16の事例と55の機会シナリオを含む)

広州黄埔低高度経済が再び「更新」、16件の事例と55の機会シナリオを含む南方網によると、7月15日、...