手があれば初心者でもデータ分析ができる

手があれば初心者でもデータ分析ができる
データ分析に関しては、多くの人が過度に複雑なモデルやツールに夢中になり、核心部分を無視する傾向があります。
「迷信を打ち破る」ために、私は分かりやすく実践的なベビーシッターガイドを書くことにしました。

量子力学ではなくデータサイエンス
言語やツールがどれだけ洗練されていても、データ分析ではデータの取得、データのクリーニング、データの理解という3つのポイントを避けることはできません。
ホットな検索は非実用的で理解しがたいものが多いので難しいです。
次に、ケースを使用してこの記事を正式に開始してみましょう。
 案例背景:你需要为景区设计文创产品,但不清楚哪类文创产品受欢迎。你想通过分析文创产品的类型、价格和销量等数据来获取灵感。比如,哪些类型的文创产品卖得最好?价格与销量之间是否存在相关性? 数据需求:包含名称、分类、价格、销量、用途、人群、材质、风格。销量排名前100个商品数据,

生データを抽出し、無効な要件を削減します。
私たちは、プラットフォームがデータを取得するのが遅すぎる、または開発に多くの困難があるのではないかと常に感じていますが、実際には、プラットフォームは役に立たないデータを要求しすぎています。
リクエストをするときは、自分自身に何度も問いかけてください。それは本当に必要ですか?代替方法はありますか?
次に、オリジナルデータ、そしてオリジナルデータの少ないものを要求してください。
 
データ抽出の範囲を制御することで、冗長な情報を処理するための計算および手作業の負担を軽減できます。そして元のデータは簡単に結合できますが、結果データは抽出が複雑なだけでなく、処理も困難です
データを取得した後、生のデータは乱雑であることが多いため、急いでデータを分析しないでください。
データがクリーンアップされていない場合、その後の分析結果が歪んだり間違ったりする可能性があります。データが「クリーン」な場合にのみ、分析ツールとモデルが機能します。
次に、データを「読み取り可能」かつ「使用可能」にするためにデータをクリーンアップする方法を見てみましょう。

理解できるまで掃除すれば、機械も理解できるようになります
ツールレベルでは、Feishu の多次元テーブルを使用することをお勧めします。これにより、後続のグラフィックスがより便利になります。
1. データのクリーニング
まず、 「故宮」、「文化と創造」、「公式旗艦店」などの無駄なキーワードを削除します。
クリーニング後は、読み取りエクスペリエンスが向上するだけでなく、機械がデータを処理するために必要な計算能力も削減されます。
必要に応じて、空の値を埋めたり、ラベル形式を統一したりして、データが明確で標準化されていることを確認するなど、他のクリーニング方法を追加できます。
2. データ分類
2-1.特徴抽出
2 番目のステップでは、貴重な特徴を抽出する必要があります。たとえば、商品名に祭り、目的、人々のグループなどが含まれる場合です。
最も簡単な方法は、スマート ラベリングに Feishu のフィールド ショートカットを使用することですが、標準化しやすいこのタイプのデータの場合は、関数抽出の方が適しています。
たとえば、 REGEXEXTRACTALL関数:
 REGEXEXTRACTALL( [商品标题], "教师节礼物|生日礼物|乔迁礼物|儿童节礼物|结婚礼物|创意礼物|伴手礼" )

この機能は、商品タイトルから一致するギフトタイプを抽出し、「目的タグ」に変換します。

タグを抽出した後は、必ず関連キーワードを再度クリアしてください。
2-2.数値による分類
カテゴリの価格分布を分析する場合、価格データがまばらだと問題を効果的に特定できません。
しかし、価格を範囲に絞り込むと、データが集中し、分析しやすくなります。
 IFS( [商品价格] <= 50 , "50以下" ,  [商品价格] <= 100 , "100以下" ,  [商品价格] <= 200 , "200以下" ,  [商品价格] <= 500 , "500以下" ,  [商品价格] <= 10000 , "500以上" )
AI以外にも、 IFS関数を使うとより便利です。価格マッチング範囲内の値を対応する間隔に分類します。
クリーニングと分類を通じて、人間と機械の両方が理解できるようになり、分析の次のステップに進むことができます。

分析: ネジを締めて、ロケットを作らない

ヘルプ!上記の原文は24,000回閲覧されています
分析によく使用されるチャートは、トレンド チャート、円グラフ、棒グラフ、バー チャート、ワード クラウドです。問題の 80% は処理できるので、ポーターの 5 つの力について心配する必要はありません...
トレンドの変動により問題をより早く発見することができ、割合と変化により重要な問題に焦点を当てることができます。複合チャートのクロス分析とドリルダウン分析により、問題をさらに特定できます。
分析に戻りましょう。
01. 文化・創造製品の種類、販売量、価格
円グラフを分析すると、売上高シェアとカテゴリーシェアがほぼ一致していることがわかります。
しかし、「その他」のカテゴリーでは紙袋の販売数が2万個であり、データが歪んでいた。
そこで、紙袋商品を除外し、装飾品、文房具、食器など主要カテゴリーの売上を再度分析しました
カテゴリーは主に装飾品(29.4%)、文房具(22.6%)、食器(20.17%)に集中しており、カテゴリー数が多いものが売れ筋でもある。そのうち、平均価格が最も高かったのは食器類(210元)で、最も低かったのは文房具類(76元)だった。
02. 販売量と価格の関係

後続の分析のために製品をカテゴリ別に絞り込みます。右上隅のボタンに気づきましたか? Feishu ドキュメントによって生成されたチャートはインテリジェントに分析できるため、効率をさらに向上させることができます。
洞察

さまざまな商品カテゴリーの中で、調理器具は最も高い価格(210)ですが、販売量は最も高くありません(877)。

ジュエリー製品(154)は価格が中程度で、販売量(506)は比較的低い。

分析する

価格と販売量の相関関係は弱い。食器を例に挙げてみましょう。価格は比較的高いですが、販売量は相当なものです。ジュエリーの価格は中程度ですが、販売量は比較的少ないです。これは、価格が販売量を決定する唯一の要因ではなく、製品の機能、市場での位置付けなどによって影響を受ける可能性があることを示しています。
03. 使用状況、人口、材質が価格と売上に与える影響

洞察:

教師の日ギフトの販売数量は1,012個となり、全用途中最多となった。

こどもの日のギフトの価格はたったの35と比較的安価です。

分析:

使用量、価格、販売量の間には一定の相関関係があります。例えば、より高価な中秋節のギフトの販売数は 700 個であるのに対し、より安価な子供の日のギフトの販売数は 400 個でした。教師の日のギフトは最も高価ではありませんが、市場の需要に合致しているか、プロモーションがより効果的であるため、売上が目立っています。

 

全体的に、価格と販売量は正の相関関係にあり、価格の高い製品は比較的販売量が多い傾向があります。

使用状況をセグメント化すると、価格と販売量の相関関係についての結論は異なります。同じ方法を使用して、群衆、素材、創造性の影響を検証できます。

タグに基づいて生成されたワードクラウドには非常に奇妙で創造的な部分があり、非標準のデータは直接抽出に適していないことも示しています。

最後のステップは、提案を出力することです。分析には意見や提案が必要です。

観点:

1) 装飾品、文具、食器類が好調で、大量生産され、販売も好調で、装飾品の販売量が29.4%と最も多かった。

2) 販売量と価格の関係は複雑で、全体的に強い相関関係はありません。調理器具などの一部の高価値製品はかなりの売上を上げていますが、他のカテゴリでは相関特性は見られません。

3) 祭りの影響が顕著:教師の日の販売(1,012個)が明らかにリードし、より高価な中秋節の贈り物も好調でした(700個)。特定の祭りは売上に大きな影響を与えます。

4) 群衆とクリエイティブのデータは参考としてあまり意味がありません。SEO ではタイトルのターゲット ユーザーが部分的にしか明確に定義されていないため、クリエイティブのワード クラウドは比較的混沌としています。ターゲットを絞った検索を行うには、カテゴリ内の上位 5 つの製品を選択することをお勧めします

 

提案:

1)カスタマイズのコストを考慮すると、装飾と文房具のカテゴリに重点を置くことをお勧めします。

2) 単語の出現頻度に基づき、季節や休日の変動による売上への影響を軽減するために、旅行用バッグや室内装飾品など、幅広い層を対象とした日常的な製品のデザインを優先することが推奨されます。

3) さらに、クリスマス冷蔵庫マグネットなど、休日をテーマにした低コストで生産が速い製品を開発することもできます。



やっと
ビジネスの量が一定レベルに達するまでは、複雑な用語にあまり力を入れないでください。高いところに立つということは必ずしも遠くまで見渡せるということではありません。
そのレベルに達したら、専任のデータアナリストも雇ってこの作業を行うことになると思います。

<<:  TaobaoとWeChat Payが仲良くなってAlipayが嫉妬?

>>:  借金とギャンブルで、広正眼科は「資本迷路」に深く陥っている

推薦する

不動産ブランドプロモーション(ブランドが「お金」の見込みを決める、不動産仲介店舗、ブランドをどう構築するか?)

ブランドが財務の見通しを決定します。不動産会社はどのようにしてブランドを構築できるのでしょうか?不動...

化粧品売上ランキング(ロレアルとバイヤスドルフ両社が声を上げているが、中国市場の何がそんなに難しいのか?)

ロレアルとバイヤスドルフ両社が声を上げていますが、中国市場の何がそんなに難しいのでしょうか?出典: ...

ストーリーベースの情報フロー広告(100以上の情報フロークリエイティブアイデアを分析し、売れ筋の手法をまとめました)

私は100以上の情報フローのアイデアを分析し、売れ筋の方法論をまとめましたでは、ユーザーを惹きつける...

WordPress にカスタム管理者通知を追加するにはどうすればいいですか?

WodPess ウェブサイトでは、ウェブサイトのテーマ、プラグイン、またはその他の情報にエラーや警告...

.tv ドメイン名を国内で登録できますか?

現在、.tドメイン名は中国工業情報化部から登録資格を取得していないため、登録できません。 .t ドメ...

Xshell で SFTP を使用してファイルを転送する方法

Xshell は、安全な端末シミュレーション ソフトウェアであり、業界で最も強力な SSH クライア...

ホームファニシングブランドプロモーション(ホームファニシング建材の海外ビジネスは引き続き好調か?複数の勢力が新たな攻勢を仕掛ける)

住宅建材の海外ビジネスは好調が続くのか?複数の勢力が新たな攻撃を開始出典:超明陸軍士官学校2024年...

データ運用管理(データミドルプラットフォームを構築することで、データ運用管理は効率化できるか?)

データミドルプラットフォームを構築することで、データに基づいた運用管理をより効率的に行うことができま...

プライベートドメイン運用データ分析(プライベートドメインの友人サークルデータ分析をうまく行うための 3 つのステップ)

プライベートな友人サークルのデータ分析をうまく行うための 3 つのステップ現在、プライベートドメイン...

ブランド卵のマーケティング(ブランド卵のプレミアムを高めるには?)

ブランド卵のプレミアムを高めるには?なぜブランド卵を作るのですか?食品の品質と健康に関心を持つ消費者...

金融商品運用(金融商品運用:比較的利用頻度の低い商品で休眠・離脱ユーザーを喚起する方法)

金融商品運用:比較的利用頻度の低い商品で休眠・離脱ユーザーを喚起する方法旧ユーザーの運用は、私たちの...

カスタム WordPress ページ テンプレートを作成する方法は?

新しいページが Web サイトに追加されると、そのページのレイアウトとデザインは現在の WodPes...

ブランドマーケティングへの洞察(消費者の洞察力を高め、ブランドマーケティング力を向上させる)

消費者の洞察力を高め、ブランドマーケティング力を向上させる企業が一定の段階まで発展すると、ブランドが...

英語での製品操作(インターネットソフトウェアでよく使われる用語60個を中国語と英語で収録、収集推奨)

インターネットソフトウェアでよく使われる60の用語(中国語と英語)を収集することを推奨します1. B...

Shopifyチュートリアル: ストアの注文を処理する方法

Shopifyを使ってストアをオープンした後、注文が来たらどうすればいいのでしょうか?この記事では詳...