データ分析に関しては、多くの人が過度に複雑なモデルやツールに夢中になり、核心部分を無視する傾向があります。 「迷信を打ち破る」ために、私は分かりやすく実践的なベビーシッターガイドを書くことにしました。
言語やツールがどれだけ洗練されていても、データ分析ではデータの取得、データのクリーニング、データの理解という3つのポイントを避けることはできません。ホットな検索は非実用的で理解しがたいものが多いので難しいです。次に、ケースを使用してこの記事を正式に開始してみましょう。 案例背景:
你需要为景区设计文创产品,但不清楚哪类文创产品受欢迎。
你想通过分析文创产品的类型、价格和销量等数据来获取灵感。
比如,哪些类型的文创产品卖得最好?价格与销量之间是否存在相关性?
数据需求:
包含名称、分类、价格、销量、用途、人群、材质、风格。
销量排名前100个商品数据,
。
私たちは、プラットフォームがデータを取得するのが遅すぎる、または開発に多くの困難があるのではないかと常に感じていますが、実際には、プラットフォームは役に立たないデータを要求しすぎています。 リクエストをするときは、自分自身に何度も問いかけてください。それは本当に必要ですか?代替方法はありますか?次に、オリジナルデータ、そしてオリジナルデータの少ないものを要求してください。 データ抽出の範囲を制御することで、冗長な情報を処理するための計算および手作業の負担を軽減できます。そして元のデータは簡単に結合できますが、結果データは抽出が複雑なだけでなく、処理も困難です。データを取得した後、生のデータは乱雑であることが多いため、急いでデータを分析しないでください。データがクリーンアップされていない場合、その後の分析結果が歪んだり間違ったりする可能性があります。データが「クリーン」な場合にのみ、分析ツールとモデルが機能します。次に、データを「読み取り可能」かつ「使用可能」にするためにデータをクリーンアップする方法を見てみましょう。
理解できるまで掃除すれば、機械も理解できるようになりますツールレベルでは、Feishu の多次元テーブルを使用することをお勧めします。これにより、後続のグラフィックスがより便利になります。まず、 「故宮」、「文化と創造」、「公式旗艦店」などの無駄なキーワードを削除します。クリーニング後は、読み取りエクスペリエンスが向上するだけでなく、機械がデータを処理するために必要な計算能力も削減されます。必要に応じて、空の値を埋めたり、ラベル形式を統一したりして、データが明確で標準化されていることを確認するなど、他のクリーニング方法を追加できます。2 番目のステップでは、貴重な特徴を抽出する必要があります。たとえば、商品名に祭り、目的、人々のグループなどが含まれる場合です。最も簡単な方法は、スマート ラベリングに Feishu のフィールド ショートカットを使用することですが、標準化しやすいこのタイプのデータの場合は、関数抽出の方が適しています。 REGEXEXTRACTALL(
[商品标题],
"教师节礼物|生日礼物|乔迁礼物|儿童节礼物|结婚礼物|创意礼物|伴手礼"
)
この機能は、商品タイトルから一致するギフトタイプを抽出し、「目的タグ」に変換します。
タグを抽出した後は、必ず関連キーワードを再度クリアしてください。カテゴリの価格分布を分析する場合、価格データがまばらだと問題を効果的に特定できません。しかし、価格を範囲に絞り込むと、データが集中し、分析しやすくなります。 IFS(
[商品价格] <= 50 ,
"50以下" ,
[商品价格] <= 100 ,
"100以下" ,
[商品价格] <= 200 ,
"200以下" ,
[商品价格] <= 500 ,
"500以下" ,
[商品价格] <= 10000 ,
"500以上"
)
AI以外にも、 IFS関数を使うとより便利です。価格マッチング範囲内の値を対応する間隔に分類します。クリーニングと分類を通じて、人間と機械の両方が理解できるようになり、分析の次のステップに進むことができます。
ヘルプ!上記の原文は24,000回閲覧されています分析によく使用されるチャートは、トレンド チャート、円グラフ、棒グラフ、バー チャート、ワード クラウドです。問題の 80% は処理できるので、ポーターの 5 つの力について心配する必要はありません...トレンドの変動により問題をより早く発見することができ、割合と変化により重要な問題に焦点を当てることができます。複合チャートのクロス分析とドリルダウン分析により、問題をさらに特定できます。円グラフを分析すると、売上高シェアとカテゴリーシェアがほぼ一致していることがわかります。しかし、「その他」のカテゴリーでは紙袋の販売数が2万個であり、データが歪んでいた。そこで、紙袋商品を除外し、装飾品、文房具、食器など主要カテゴリーの売上を再度分析しました。カテゴリーは主に装飾品(29.4%)、文房具(22.6%)、食器(20.17%)に集中しており、カテゴリー数が多いものが売れ筋でもある。そのうち、平均価格が最も高かったのは食器類(210元)で、最も低かったのは文房具類(76元)だった。後続の分析のために製品をカテゴリ別に絞り込みます。右上隅のボタンに気づきましたか? Feishu ドキュメントによって生成されたチャートはインテリジェントに分析できるため、効率をさらに向上させることができます。 洞察
さまざまな商品カテゴリーの中で、調理器具は最も高い価格(210)ですが、販売量は最も高くありません(877)。
ジュエリー製品(154)は価格が中程度で、販売量(506)は比較的低い。
分析する
価格と販売量の相関関係は弱い。食器を例に挙げてみましょう。価格は比較的高いですが、販売量は相当なものです。ジュエリーの価格は中程度ですが、販売量は比較的少ないです。これは、価格が販売量を決定する唯一の要因ではなく、製品の機能、市場での位置付けなどによって影響を受ける可能性があることを示しています。
03. 使用状況、人口、材質が価格と売上に与える影響洞察:
教師の日ギフトの販売数量は1,012個となり、全用途中最多となった。
こどもの日のギフトの価格はたったの35と比較的安価です。
分析:
使用量、価格、販売量の間には一定の相関関係があります。例えば、より高価な中秋節のギフトの販売数は 700 個であるのに対し、より安価な子供の日のギフトの販売数は 400 個でした。教師の日のギフトは最も高価ではありませんが、市場の需要に合致しているか、プロモーションがより効果的であるため、売上が目立っています。
全体的に、価格と販売量は正の相関関係にあり、価格の高い製品は比較的販売量が多い傾向があります。
使用状況をセグメント化すると、価格と販売量の相関関係についての結論は異なります。同じ方法を使用して、群衆、素材、創造性の影響を検証できます。タグに基づいて生成されたワードクラウドには非常に奇妙で創造的な部分があり、非標準のデータは直接抽出に適していないことも示しています。最後のステップは、提案を出力することです。分析には意見や提案が必要です。
観点:
1) 装飾品、文具、食器類が好調で、大量生産され、販売も好調で、装飾品の販売量が29.4%と最も多かった。
2) 販売量と価格の関係は複雑で、全体的に強い相関関係はありません。調理器具などの一部の高価値製品はかなりの売上を上げていますが、他のカテゴリでは相関特性は見られません。
3) 祭りの影響が顕著:教師の日の販売(1,012個)が明らかにリードし、より高価な中秋節の贈り物も好調でした(700個)。特定の祭りは売上に大きな影響を与えます。
4) 群衆とクリエイティブのデータは参考としてあまり意味がありません。SEO ではタイトルのターゲット ユーザーが部分的にしか明確に定義されていないため、クリエイティブのワード クラウドは比較的混沌としています。ターゲットを絞った検索を行うには、カテゴリ内の上位 5 つの製品を選択することをお勧めします。
提案:
1)カスタマイズのコストを考慮すると、装飾と文房具のカテゴリに重点を置くことをお勧めします。
2) 単語の出現頻度に基づき、季節や休日の変動による売上への影響を軽減するために、旅行用バッグや室内装飾品など、幅広い層を対象とした日常的な製品のデザインを優先することが推奨されます。
3) さらに、クリスマス冷蔵庫マグネットなど、休日をテーマにした低コストで生産が速い製品を開発することもできます。
ビジネスの量が一定レベルに達するまでは、複雑な用語にあまり力を入れないでください。高いところに立つということは必ずしも遠くまで見渡せるということではありません。そのレベルに達したら、専任のデータアナリストも雇ってこの作業を行うことになると思います。