エンタープライズ オペレーション ビッグ データ (ビッグ データは製品とオペレーションをどのように推進しますか?)

エンタープライズ オペレーション ビッグ データ (ビッグ データは製品とオペレーションをどのように推進しますか?)

ビッグデータはどのようにして製品や業務を推進するのでしょうか?

Come to Everyoneはプロダクトマネージャー[Starting Point Academy]で、BATの実践的なプロダクトディレクターが製品と運用について段階的に教えてくれます。

2011年、2012年にビッグデータの概念が普及して以来、近年では多くの伝統的な企業やインターネット企業がビジネスにビッグデータを活用し、より多くのビッグデータ思考を提唱していると言えます。

では、ビッグデータ思考とは何でしょうか? 2つの例を見てみましょう。

【ケース1:入力方法】

まず、入力方法の例を見てみましょう。私は 2001 年に大学に入学しましたが、当時よく使っていた入力方法は Smart ABC、Microsoft Pinyin、Wubi でした。当時の入力方法は現在よりもずっと遅かったです。多くの場合、単語を複数回選択する必要があり、単語を入力する前に単語を選択したり調整したりする必要がありました。効率は非常に低かったです。

2002 年と 2003 年に、新しい入力方法である Ziguang Pinyin がリリースされました。本当に速く感じました。キーを押す前に単語がポップアップ表示されます。しかし、すぐに紫光ピンイン入力方式にも問題があることが判明しました。例えば、当時はインターネットが急速に発展しており、新しい言葉が頻繁に登場していました。これらの単語が語彙になかったら、単語を入力するのは困難でしょう。

2006年頃、Sogou入力方式が登場しました。 Sogou 入力方法は、Sogou 自体が検索エンジンであるという事実に基づいています。ユーザーが入力した検索用語のデータと、ユーザーが入力方法を使用したときに生成された単語に関する情報を蓄積します。統計分析を行い、徐々に新しい単語を語彙に追加し、クラウドを通じて管理します。

例えば、昨年は「然兵卵」という言葉が流行りました。このような単語を従来の方法で探す場合、再構成された単語であるため、入力方法でピンイン「ran bing luan」を介して直接見つけることはできません。しかし、ビッグデータの考え方では違います。つまり、最初はそんな単語があることを知らないのですが、多くの人がこの単語を入力していることがわかります。したがって、統計を使用して、最近出現した新しい高頻度単語を発見し、それを宝庫に追加してすべての人に更新することで、誰もがその単語を使用するときに直接見つけることができるようになります。

データドリブンに関しては、数字を見る習慣がなかった人が、数字を見る習慣を身につけることで大きな進歩を遂げた人もいるかもしれません。いくつかの数字を見ることができるということは、データ主導型であることを意味しますか?これでは十分とは言えません。データ駆動とは何かについてお話ししましょう。あるいは、既存のスタートアップがデータ駆動型になる際に抱えるいくつかの問題。

ある状況では、会社にデータ エンジニアがいて、その仕事はデータを実行することです。

市場、製品、オペレーション、上司など、誰もがさまざまなデータニーズを持ち、それらはすべて彼に提起されます。しかし、このリソースは限られており、彼の労働時間も限られています。彼はリクエストを一つずつしか処理できません。彼は仕事で非常に忙しいため、出されたリクエストはすぐには処理されず、しばらくお待ちいただく必要があるかもしれません。この要求が満たされたとしても、一方では、データが完全に準備されていない可能性があり、データを収集したり、アップグレードを行ったり、データを取得したりする必要があります。データを受け取った後、分析を実施します。このプロセス自体は 2 ~ 3 日かかる場合があり、待機時間も含めるとさらに時間がかかる場合があります。

人によっては、待機期間が長すぎて、チャンス全体を逃してしまう可能性があります。例えば、自分にとって大切なのがお祭りや新学期などの時期であり、その後に運営関連のことをしたい場合、この機会を逃してしまう可能性があり、多くの人は待ちきれません。学生の中には、データを待たずに単に気まぐれで決定を下す人もいるかもしれません。このプロセスは実は非常に非効率的です。データが取れないのではなく、効率が低いために多くの機会を逃してしまったのです。

企業によっては、以前は数字すらなかったのに、今ではダッシュボードがある場合もあります。ダッシュボードを使用すると、前四半期と昨日の会社全体のデータを確認できるので、非常に便利です。

上司にとっては嬉しいことなのでしょうが、マーケティングやオペレーションを学ぶ学生にとってはそれだけでは不十分かもしれません。

たとえば、ある日にユーザー数が 20% 減少したことがわかった場合、それを無視することはできず、問題がどこにあるのかを突き止める必要があります。現時点では、マクロの数字だけを見るだけでは十分とは言えません。通常、データをセグメント化し、地域、チャネル、その他のさまざまな方法で追跡して、何が欠落しているか(全体的なデータなのか、特別なチャネルの特定の場所でデータが欠落しているのか)を確認する必要があります。現時点では、ダッシュボードだけに頼るだけでは不十分です。

理想的なデータ駆動型の状態とはどのようなものでしょうか?これは、すべてのビジネス担当者がデータ分析を実行し、データを習得できるようにするセルフサービス データ分析です。

先ほどモデルについてお話しました。私たちの情報源は、乱雑なデータの集まりです。真ん中にはデータを処理するエンジニアがいます。次に、右側では、さまざまなビジネス関係者が要求を出し、処理のために列に並びます。この方法は非常に非効率的です。理想的には、ビッグデータ ソースが適切に整理され、完全かつ詳細であり、すべての営業担当者が直接操作できる強力な分析ツールが提供されることが望まれます。全員が同時に作業してビジネス データのニーズを満たすことができるため、効率が大幅に向上します。

ビッグデータ分析を非技術的な観点から見ると、ピラミッドに分けることができます。下から上に3つの部分があります。最初の部分はデータ収集、2 番目の部分はデータ モデリング、3 番目の部分はデータ分析です。一つずつ見ていきましょう。

【データ収集】

まず、データ収集についてお話しします。私は百度で7年間データ関連業務に携わりました。私の最大の経験は、データをより有効活用したい場合、最も重要なのはデータ ソースであるということです。データ ソースが準備されると、他のすべては簡単になります。

優れたクエリ エンジンを使用するか、低速のクエリ エンジンを使用するかによって、消費される時間に違いが生じる可能性があります。しかし、データソースが貧弱であれば、アルゴリズムがいかに複雑であっても問題を解決できず、正しい結論を得ることが難しい場合があります。

優れたデータ処理プロセスには 2 つの基本原則があると思います。1 つは完全性、もう 1 つは詳細性です。

  • Quan: つまり、複数のデータ ソースが必要なのです。クライアント データ ソースを 1 つだけ持つことはできません。サーバー データ ソースもデータベース データ ソースもありません。分析を行うときにこれらのデータがないと、間違った結果になる可能性があります。なお、ビッグデータとはサンプルではなく総量を指します。特定の州のデータだけを取って、全国の状況について語り始めることはできません。いくつかの州は非常に特殊かもしれません。たとえば、新疆ウイグル自治区やチベットの顧客は中国本土の顧客とは大きく異なる可能性があります。
  • 詳細: 実際、多次元性を強調しています。データを収集するときは、すべてのディメンション、属性、フィールドを収集するようにしてください。たとえば、場所、人、方法などの項目が置き換えられると、後で分析するときにこれらの選択されたディメンションから抜け出すことができなくなり、最初のニーズに焦点が当てられなくなります。この要求に基づいて、特定のデータが生成されることが決定されます。後から新たな需要が生じた場合は、新たなデータを収集する必要があります。この時点で、反復サイクル全体は大幅に遅くなり、効率は大幅に低下します。可能な限りソースからデータを収集するようにしてください。

データモデリング

データが利用可能になったら、それを処理する必要があります。生データは乱雑で適切なロジックが備わっていない可能性があるため、上位のビジネスアナリストに直接報告することはできません。

これには、データ フレームワークの構築が含まれます。まず、データモデルの概念について説明します。データ モデルという言葉を聞くと、深遠で複雑なものだと考えて怖がる人も多いかもしれませんが、実際は非常に単純です。

春節の間、家で何かをしました。私の家系図は文化大革命の際に焼かれました。その後、私の家族の年長者たちは、家系図やその他のものをアーカイブに保管しなければならないと言いました。私はコンピューターの使い方を知っているので、コンピューターを使って家族のデータや関係、そして系図情報全体を整理するのを手伝いました。

現実には、個人、つまり家系図上の人物が存在し、ツリー構造とそれらの間のデータ関係を通じて、いくつかの簡単な図で実際のエンティティを表すことができます。これはデータモデルです。

データ モデルは、現実世界のデータの抽象的な表現です。これは私たちのようなスタートアップではよくあることです。現在のビジネスでは、通常、フロントエンドがリクエストを行い、それがデータベースで処理されて更新されます。データベースには一連のデータ テーブルが構築されており、データ テーブル間には多くの依存関係があります。

たとえば、私の図に示すように、1 年以上かけて開発されるビジネス アイテムには数十または数百のデータ テーブルが含まれることがあり、これらのテーブルはビジネス アナリストに直接提供されて使用されるため、理解するのが非常に困難です。

このデータ モデルは、通常の業務運営に対応するために使用され、製品の通常の運用のために構築されたデータ モデルです。ただし、これはアナリストが使用するモデルではありません。それをデータ分析に使用しようとすると、多くの問題が生じます。たとえば、理解するのは非常に困難です。

さらに、データ分析はテーブル間のグリッドに大きく依存します。たとえば、ある日、パフォーマンスを向上させるために、テーブルを分割したり、フィールドを追加したり、単語を削除したりしました。この調整は分析のロジックに影響します。

ここでは、分析のニーズに応じてデータを再デコードするのが最適です。内容は一貫しているかもしれませんが、構成方法は変更されています。たとえば、ユーザーの行動データを抽象化して、判断表として使用することができます。

これにより、製品の閲覧、閲覧者、閲覧日時、使用したオペレーティング システムとブラウザーのバージョン、閲覧した製品、閲覧した製品の属性など、ユーザーが製品に対して実行する一連の操作を適切に抽象化できます。このタイプのサンプリングの大きな利点は、理解しやすいことです。一目で何の表かがわかり、分析にも便利です。

データ分析、特にユーザー行動分析の観点では、現在比較的効果的なモデルは、オンライン分析および処理モデルである多次元データモデルです。ディメンションとインジケーターという 2 つの重要な概念が含まれています。

ディメンションには、都市、北京、上海、ディメンションの西側にあるいくつかの属性、オペレーティング システム、IOS と Android、およびディメンション内の属性が含まれます。

ディメンションを交差させることで、指標となるユーザー数や売上などのいくつかの指標の問題を見ることができます。たとえば、このモデルを通じて、北京の iOS ユーザーの全体的な売上を確認できます。

ここでは 2 つの次元のみを示しますが、他にも多くの次元がある可能性があります。つまり、ディメンションの組み合わせを通じていくつかの指標の数値を見ることができます。頻繁に使用するこれらのビジネスのデータ分析ニーズの多くは、この単純なモデルを通じてサンプリングできるかどうかを思い出すことができます。

次に、インターネット製品で使用されているデータ分析方法を見てみましょう。

インターネット製品で一般的に使用されるユーザー消費分析には、次の 4 つの種類があります。

  1. 1 つ目は、多次元イベントの分析であり、次元間の組み合わせと関係を分析します。
  2. 2 番目のタイプはファネル分析であり、これは電子商取引や注文関連の製品にとって非常に重要です。それは、さまざまなチャネルがこれらのものをどのように変換するかによって異なります。
  3. 3 番目のタイプのリテンション分析は、ユーザーが来店した後も継続して来店し、購入してくれることを期待するものです。これが保持です。
  4. 4番目のタイプは再訪問です。再訪問は特別な形の維持です。一定期間内の訪問頻度、または訪問期間を確認できます。

方法1: 多次元イベント分析

まずは、運用や製品の改善に共通する効果分析である多次元イベントの分析について見てみましょう。実際、ほとんどの場合、多次元イベント分析を使用して、データの統計分析を実行できます。

1. 3つの重要な概念

実際には、イベント、ディメンション、インジケーターという 3 つの主要な概念で構成されています。

  • イベントとは、あらゆるインターネット製品を一連のイベントに抽象化できることを意味します。たとえば、電子商取引製品の場合、商品の送信、注文、登録、受け取りなどの一連のユーザー行動に抽象化できます。
  • 各イベントは一連の属性で構成されます。たとえば、使用しているオペレーティング システムのバージョンが WiFi に接続されているかどうかなど。たとえば、注文関連の送料、合計注文価格、またはユーザーの機能属性など、これらは一連のディメンションです。
  • これらの側面に基づいたいくつかの指標を見てみましょう。例えば、注文の提出については、提出された注文の総数を指標にしてもよいし、注文を提出する人数を指標にしてもよいし、一人当たりの平均回数を指標にしてもよい。注文の合計金額と合計価格も指標であり、運賃も指標です。数値をカウントした後、それをインジケーターにサンプリングすることができます。

2. 多次元分析の価値

多次元分析の価値を確認するために例を見てみましょう。

たとえば、注文の支払いイベントの場合、総取引額の時間曲線をたどると、ずっと下がっていることがわかります。しかし、株価が下落したときは、ただ下落するのを見ているだけではだめで、その理由を分析しなければなりません。

その理由をどう分析するか?よく使われる方法は、次元を細分化することです。地域別、チャネル別、年齢層別、性別別などの特定のディメンションに従ってデータを分割し、これらのデータが全体として減少しているのか、特定の種類のデータが減少しているのかを確認できます。

これは仮説的な例ですが、支払い方法を分類すると、Alipay、AliPAY、WeChat Pay、銀行支払いの 3 つの支払い方法があります。

データによれば、Alipayと銀行決済は基本的に安定した状態にある。しかし、WeChat決済を見てみると、当初の最大額から現在ではごくわずかな額にまで減少していることがわかります。この分析は、支払い方法としての WeChat には何らかの問題があることを示しています。

たとえば、減少の原因はインターフェースのアップグレードによるものでしょうか、それとも WeChat 自体の問題によるものでしょうか?

方法2: ファネル分析

ファネル分析では、データに基づいて、最初のステップから後続の各ステップまでのユーザーの行動が複雑なプロセスである可能性があることを示します。

たとえば、あるグループのユーザーが最初にホームページを閲覧します。ホームページを閲覧した後、直接離脱するユーザーもいれば、商品をクリックするユーザーもいます。商品をクリックした後、多くの人が再び離脱し、その後、実際に購入する人もいます。これは実際には漏斗です。

このファネルを通じて、コンバージョン状況を段階的に分析することができます。各ステップでロスが発生するため、異なるチャネルの変換状況を分析できます。たとえば、広告を出す際に、Baidu からのユーザー ファネル変換効果が良好であることがわかった場合は、Baidu での広告にさらに投資する可能性があります。

方法3: 保持分析

たとえば、マーケティング キャンペーンを企画し、登録ユーザーのグループを集めます。次に、彼らの主要な行動の特徴を見ていきます。たとえば、同じ日に操作がある場合、翌日に重要な操作を実行する人数はどれくらいか、N 日目には操作がいくつあるかなどです。彼らが留まるかどうかを確認するためです。

方法4: フォローアップ分析

フォローアップ訪問は、特定の行動の適度な特徴を調べるためのものです。たとえば、金の購入行動の場合、週に少なくとも 1 日は金を購入する人が何人いるか、少なくとも 2 日は金を購入する人が何人いるか、少なくとも 7 日は金を購入する人が何人いるか、または金の購入回数の分布は、フォローアップの再購入の分析になります。

上記の 4 種類の分析を組み合わせることで、訪問数やアクティブ ユーザー数のマクロ レベルだけを見るよりも、製品のデータ サポートとデータ駆動型の性質をより深く理解できるようになります。

以下では、運用と分析における私の個人的な実践についてお話ししたいと思います。

【事例1:UGC商品】

まずはUGC商品のデータ分析の例を見てみましょう。トラフィック、新規ユーザー数、獲得ユーザー数、投稿数、減少数を分析する場合があります。

Tieba、Baidu Knows、Zhihu などの製品はすべてこのカテゴリに属します。このような製品の場合、製品の状況を特定の角度から観察するために使用できるデータ指標が多数存在します。そこで疑問になるのが、指標がたくさんある中で、何に焦点を当てるべきかということです。さまざまな段階でどのような指標に注目すべきでしょうか?これには、指標自体の処理と主要指標の発行が含まれます。

【事例2:離脱したユーザーの呼び戻し】

この形式は他の製品には非常に効果的かもしれませんが、当社の製品の場合、ターゲットが比較的明確でニッチであるため、この配置の効果はそれほど明白ではない可能性があります。

今年のお正月には、多くの方が弊社の製品を試用したいとお申し込みをいただいたのですが、アカウント発行後、1万人の方が戻ってきませんでした。そこで私たちは新年に全員に挨拶し、その後進捗状況を報告して、何人かを採用できるかどうかを確認しました。

元旦における弊社製品の全体的なユーザー状況です。元旦までに、9月25日に製品が発売されてからほぼ2〜3か月が経過していました。当時、約1,490名の方が当社製品の試用を申し込んでくださりました。しかし、実際に挑戦したのは約半数の724人だけで、残りの半数は逃げて行方不明になった。

私たちは、これらの人々を選び、採用活動を実施したいと考えています。失われたユーザーのリストをエクスポートできます。弊社の自社製品にもそのような機能がございます。どのようにしてユーザーからこの情報を取得するのか疑問に思う人もいるかもしれません。

トライアルに申し込む際に、名前、連絡先、会社情報などを記入していただくため、これらは追加されません。メールアドレスをご記入いただいた方にはメールをお送りいたします。携帯電話番号を送信していただいた方には、テキストメッセージをお送りいたします。これら 2 つのチャネルの効果を分析します。

まずは全体の数字についてお話ししましょう。合計で716人にメッセージを送信しました。これは以前より少し少ない数です。信頼できない情報を手動で削除しました。次に、実際にこの製品を体験した人が 35 人いるかどうかを確認し、その 35 人のうち 4 人がデータへのアクセスを申請します。

製品にちょっとした改良を加えたので、テスト環境では、テスト環境自体のデータで遊んでみて、興味が湧いたら自分の実データで試してみます。現時点では、独自のデータへのアクセスを申請するためのリンクが用意されています。このステップに到達すると、当社の正式な顧客になる可能性が高くなります。

私たちは、実際にこれら 2 つの方法の変換効果について非常に懸念しています。リコールの影響は何ですか?下の赤いボックスに示すように、394 通のメールが送信されました。結局、実際に試しに来てくれたのは32人、電話はメールと同じくらいの322件でしたが、来たのは3人だけで、2つの効果は8倍も違っていたということになります。

これは、多くの人がテキスト メッセージをめったに読まないかもしれないということを実際に皆に思い出させます。もちろん、一方では自社製品の特性とも関係があります。弊社製品はパソコンでより便利にご利用いただける製品です。携帯電話でこのリンクを見るとクリックできないという方も多いかもしれませんし、クリックした後に口座番号を入力するのも少し面倒です。そのため、効果は比較的劣ります。

著者 @Sang Wenfeng

ソース @36氪

<<:  エンタープライズコンテンツ運用(優れたコンテンツ運用のための3つの要素)

>>:  高品質コンテンツ運用(ヒットするセルフメディアづくりガイド:高品質コンテンツをつくる6つのステップ)

推薦する

製品運用機能(Suning Retail Cloudの4つの主要なアップグレード:店舗シナリオ、製品供給、サービス履行、ターミナル運用)

Suning Retail Cloudには、店舗シナリオ、製品供給、サービス履行、ターミナル操作の...

CloudFlare アカウントにドメイン名を追加するチュートリアル

クラウドフリーサンフランシスコに本社を置くアメリカの多国籍テクノロジー企業です。 CloudFle ...

ポート番号の使用状況を確認する Linux サーバー コマンド

海外のサーバーを借りてウェブサイトを構築した後、アプリケーションを起動するときに、関連するポート番号...

ニューメディア事業の主な業務内容(ニューメディア事業の雇用見通し、教育要件、給与見通し)

新しいメディア事業における雇用見通し、教育要件、給与見通し今日の時代のトレンドセッターとして、新しい...

どの情報フロー広告が良いのか(どの情報フロー広告が良いのか?効果がより顕著になる)

どの情報フロー広告が最適ですか?効果はより明らかになるだろう昨今、情報流通は盛んですが、どのように...

SSL 証明書を購入してから有効になるまでにどのくらいの時間がかかりますか? SSL 証明書の有効期間はどのくらいですか?

ウェブサイトが https 暗号化アクセスを実現したい場合、SSL 証明書がなければ実現できません。...

ホテル事業データ分析ppt(一軒の老舗が静かに姿を消し、温州のホテル宿泊業界は大きな変化を遂げる)

古い一軒家が消滅したことで、温州のホテル宿泊業界は大きな変化を迎えた。ジンジャンイン株式会社が所有す...

DHAプロモーションコピー(inneは業界の専門家と協力し、DHAの開発を標準化し、DHAサミットフォーラムは業界のマイルストーンとなる)

inneは業界の専門家と協力し、DHAの開発を標準化し、DHAサミットフォーラムは業界のマイルスト...

Xshell が仮想マシンに接続できない問題と解決策

Xshell は、ユーザーに非常に効率的なリモート操作を提供できる強力な機能を備えた安全な端末シミュ...

サービスブランド企画会社(価値100億元の国家ブランド3つを締結、東済は2023年中国トップ10戦略機関の1つに選出)

東済は100億元相当の3つの国家ブランドと契約を締結し、2023年の中国トップ10戦略機関の1つに選...

第26回全国普通話推進週間(教育部他9部門による第26回全国普通話推進週間開催のお知らせ)

教育部と他の9つの部門による第26回全国普通話宣伝週間の開始に関する通知教育部と他の9つの部門による...

ブランド企画とブランドマーケティング(2022年ブランドマーケティング計画をどう説明するか?ディーラーは聞いて自信が持てるか?)

2022年のブランドマーケティング計画をどのように説明すればよいでしょうか?ディーラーはそれを聞い...

Shopify の独立したウェブサイトを運営するのは簡単ですか? Shopify独立ステーションプラットフォームの機能

ショッピファイ独立したウェブサイトを構築するのは簡単ですか? Shopify は世界トップクラスのワ...