データ運用スペシャリスト(データ分析実務丨インターネット業界にはどのようなデータ人材が必要か?)

データ運用スペシャリスト(データ分析実務丨インターネット業界にはどのようなデータ人材が必要か?)

データ分析の実践丨インターネット業界にはどのようなデータ人材が必要ですか?

インターネット業界の発展とデータの爆発的な増加により、データ人材の需要が高まり、その需要は日々増加しています。専門ソーシャルプラットフォームLinkedInが発表した「2019年中国新興キャリアレポート」によると、データアナリストの雇用成長率はすべての新興職種の中で5位にランクされており、中国の人材市場で最も急速に成長している職種の1つです。データ関連の仕事は中国で急速に発展している新興職業であるため、採用市場ではそれに関する情報がまだ不完全です。採用担当者として、私たちはより多くのデータ人材を引き付け、彼らに適切な給与と福利厚生を提供したいと考えています。応募者として、自分の能力を適正に評価し、適切なデータ職種と企業を選択したいと考えております。では、データ関連の職種に求められる人材の具体的な要件は何でしょうか?データ人材は、どうすれば自分に適したポジションを選択できるでしょうか?より高い給料を得るためには、自分自身のどのような面を改善する必要がありますか?

この記事のデータは、インターネット業界向けの垂直採用プラットフォームである Lagou.com から収集されたものです。データアナリスト、データマイナー、データオペレーターの3つのポジションでデータがクロールされ、合計2,550のサンプルが取得されました。給与は企業のデータ人材に対する需要を反映し、応募者の能力を測る直感的な要素であるため、平均給与はモデルの従属変数とみなされます。独立変数は、仕事の要因、求職者の要因、会社の要因の 3 つのカテゴリに分類されます。各変数の詳細な説明は次のとおりです。

まず、モデルの従属変数である平均給与を見てみましょう。インターネット業界のデータ関連職種の給与は3,000~80,000元の範囲で、明らかに右に偏った分布を示しており、給与が非常に高い職種がいくつかあることが示されており、それがデータ関連職種の平均給与水準を押し上げている。具体的には、平均給与は20,200元、中央値は18,000元です。

給与の対数を取った後、データ職位タイプのグループ化されたボックス プロットが描画され、3 つの職位の給与レベルが比較されます。図からわかるように、データマイナーの総給与が最も高く、次いでデータアナリストとなっていますが、データ運用スペシャリストの給与水準は大幅に低くなっています。その中で、データアナリストのサンプルサイズが全体のサンプルの中で最大の割合を占めています。

なぜ職種によって給与に大きな差があるのでしょうか?答えは求人情報の中にあるかもしれません。職務記述書には、職務内容や職務要件などの情報が含まれます。データ操作スペシャリスト、データアナリスト、データマイナーの職務内容を細分化し、それぞれに高頻度語のワードクラウド図を描きます。データ操作スペシャリスト職のワードクラウド マップでは、データ、操作、ビジネス、コミュニケーション、監視、レポートなどの単語が頻繁に使用されます。データアナリスト職のワードクラウド図では、データ、分析、ビジネス、統計、製品、レポート、チームなどの単語が頻繁に登場し、SQLも登場します。これは、データ アナリストには、データ操作よりも高度な専門知識と強力なビジネス能力が必要であることを示しています。データマイナーのワードクラウド図には、アルゴリズム、機械学習、ビジネス、モデル、言語、開発、テクノロジー、Python などの単語が頻繁に登場します。これは、最初の 2 つと比較して、データ マイナーは技術的なモデル知識、プログラミング言語、開発能力などをより重視するため、一般的に給与が高くなることを示しています。共通しているのは、3 つの職種すべてにおいて、応募者のビジネス知識、チーム意識、コミュニケーション能力に対する要件が高いことです。


各都市の給与水準から判断すると、一級都市は雇用数と給与水準の両方で他都市をリードしており、サンプルの77.8%を占めています。私の国の政治、技術、経済の中心地である北京では、データ関連の職種の給与水準が最も高く、深セン、上海がそれに続きます。二級都市も台頭し始めており、杭州の給与水準はすでに広州を上回っており、武漢も強い勢いを見せている。他の都市の職業の全体的な給与水準は高くありませんが、それでも一級都市と同等の高給の仕事は数多くあります。

下の図は、さまざまな都市の雇用数を示す棒グラフです。横方向の視点で見ると、北京、上海、広州、深センの1線都市は依然としてデータ関連雇用数で上位にランクされており、北京がトップを占め、雇用数は2位の上海と3位の深センの雇用数の合計とほぼ等しく、他の都市を大きく上回っています。垂直的な観点から見ると、データアナリストの需要はすべての都市で最も高くなっています。

上記のワードクラウドチャートに登場した SQL や Python などのソフトウェアスキルは、就職活動の成功に重要な要素です。当然、データ関連の職種にはどのようなスキルが求められるのか考えるかもしれません。賃金に影響はありますか?各ソフトウェア スキルについて、そのスキルを含むすべての職種の平均給与の棒グラフを描きます。図からわかるように、応募者に Excel スキルを要求する職種では、平均月給が最も低くなります。このタイプのポジションに求められる技術要件は高くなく、基本的なデータ分析とレポート作成に Excel を使用できる能力があれば十分なので、給与は比較的低いと思います。 R と Python を必要とする職種では給与が高く、平均給与は 20,000 元を超えます。 Spark、Hadoop、Javaなどのビッグデータ技術を必要とする職種は給与が最も高く、平均給与は25,000元を超えています。

上図の最初の 6 つの最も一般的なソフトウェア スキルを例に、3 種類の職種のグループ化された棒グラフを描き、各職種に必要なソフトウェアの特性を調べます。図からわかるように、データ アナリストが最も多く挙げているスキルは、SQL、Python、R です。データ分析職の 60% 以上で SQL スキルが求められ、40% 以上の職種で Python と R が求められています。データ マイナーの間で最も頻繁に挙げられるスキルは Python です。データマイニング職の約 80% では、応募者に Python スキルが求められており、これは他のスキルの割合をはるかに上回っています。データ操作スペシャリストの場合、最も要求される言語は Excel で 40% 以上を占め、次いで SQL となっています。 Python と R の要件は高くありません。

職務経験のグループ化されたボックス プロットから、職務経験の要件が増えるにつれて給与が増加する傾向があることがわかります。これは、職務経験が仕事の給与に影響を与える重要な要素であることを示しています。職務経験が増えるにつれて、給与も上がり続けます。

教育レベルのグループ化されたボックスプロットから、教育レベルが上昇するにつれて、仕事の給与が着実に増加することがわかります。博士号以上の学位を持つ応募者は最も高い平均給与を受け取り、大学卒業以上の学位を持つ応募者は最も低い給与を受け取ります。ほとんどの職種では応募者に学士号以上の学歴を求めており、サンプルの81.7%を占めている。

独立変数における企業の要素には、資金調達段階や企業規模が含まれます。上場企業の平均給与は最も高く、資金調達やエンジェルラウンドの資金調達を行っていない企業は最も低い給与となります。しかし、資金調達のどの段階でも、企業が提供する最高給与と最低給与はほぼ同じです。企業の規模は、別の観点からその企業の強さを反映します。企業の従業員数が増えると、企業が提供する給与も上がり続け、大企業では最も高い給与が支払われます。

1. 対数線形回帰モデル

従属変数として職位の平均給与を使用し、独立変数として職位の種類、勤務地、ソフトウェアスキル、職務経験、教育、資金調達段階、企業規模を使用しました。異常なサンプルを削除した後、対数線形回帰モデルを確立し、変数選択に AIC 基準を使用しました。回帰係数の推定値から、他の要因を変更せずに制御した場合、次のことがわかります。

  1. 職種: データ運用スペシャリストの平均給与は最も低く、データマイナーの平均給与は最も高く、データ運用スペシャリストよりも 41% 高くなっています。データアナリストの給与は両者の中間で、平均するとデータ運用スペシャリストの給与より 14% 高くなります。
  2. 勤務地: 北京のデータ職の給与水準は最も高くなります。他の都市と比較すると、北京のデータ職の平均給与は47%高く、上海のデータ職の平均給与は39%高く、深セン、杭州、広州ではそれぞれ38%、33%、20%高くなっています。
  3. ソフトウェア スキル: SQL、Python、Hive、SAS、Spark を必要とする職種では、それらを必要としない職種よりも平均給与がそれぞれ 5%、9%、8%、5%、7% 高くなります。逆に、Excel と SPSS の熟練度を必要とする職種では、必要としない職種よりも平均給与がそれぞれ 11% と 5% 低くなります。これは、Excel や SPSS が比較的単純であり、そのような職種では複雑なスキルは必要なく、給与水準も比較的低いためです。
  4. 職務経験: 応募者に 5 年以上の職務経験を求める職種では、職務経験を求めない職種よりも平均給与が 67% 高くなります。 3~5 年の経験を必要とする仕事は、経験を必要としない仕事よりも 33% 高い給料が支払われます。
  5. 教育: 教育は仕事の給与に影響を与える重要な要素です。修士号以上の学位を持つ人の平均給与は、大学学位以上の学位を持つ人の平均給与よりも 43% 高くなります。
  6. 資金調達段階: 資金調達の未実施またはエンジェル ラウンドの企業の平均給与は最も低く、資金調達の C ラウンドおよび D ラウンドの企業は最も高い給与を提示します。これは、資金調達の未実施またはエンジェル ラウンドの企業の平均給与より 11% 高いです。上場企業は、資金提供を受けていない企業やエンジェルラウンドで資金提供を受けた企業よりも平均で 7% 多く支払います。
  7. 企業規模: 中小企業と比較すると、大企業のデータ職の給与は平均で 18% 高く、中規模企業の給与は平均で 8% 高くなります。

(2)各ポジションを個別にモデル化する

前回の記事では、データ職の給与に影響を与える要因の全体的な状況を分析しました。応募者の皆さん、特定の職種に応募したい場合、どのようなスキルを磨くべきでしょうか?このポジションの場合、給与を上げるためにプラスになるスキルは何ですか? 3 つのデータ ポジションについて、関連スキルを習得していない人をベンチマーク グループとして、対数線形回帰モデルが確立されました。重要なソフトウェア スキル変数の回帰係数を下の図に示します。

正の回帰係数は、スキルが仕事の給与に対して昇給効果を持つことを示し、負の回帰係数は、スキルが仕事の給与に対して抑制効果を持つことを示します。図から、さまざまな職種に応募する際の追加ポイントをまとめることができます。

  1. データ アナリスト: Hive、Python、SAS、SQL のスキルは、データ アナリストの給与を上げる重要な要素であり、それぞれ元の給与の 1.111 倍、1.096 倍、1.057 倍、1.049 倍に給与を増やすことができます。
  2. データ マイナー: Spark スキルを習得すると、給与が 1.084 倍に増加します。
  3. データ操作スペシャリスト: SQL スキルを習得すると、給与が当初の額の 1.136 倍に増加する可能性があります。

全体的に、データアナリスト、データマイナー、データオペレーションスペシャリストのいずれであっても、Excel スキルの回帰係数は負であり、応募者に Excel の習得を要求する職種の給与は高くないことを示しています。特にデータ操作スペシャリストの場合、従来、データ管理とレポート作成に Excel を使いこなす必要があります。しかし、回帰分析の結果、Excel スキルは給与の伸びを抑制し、SQL スキルは給与を 13.6% 増加させる可能性があることが示されており、データ操作スペシャリストの職種では応募者に高度な技術スキルがますます求められていることがわかります。どのような職種に応募する場合でも、重要なのは自分のスキルを向上させることだけです。

独立変数はすべて質的変数であるため、回帰ツリー モデルは従来の回帰モデルよりも説明効果が強くなります。

第 1 レベルのノードは職務経験です。経験年数が3年未満の職種は給与が低く、左部門に入ります。就業経験3年未満の職種では、データマイナーの給与が最も高く、約22,004元で、データアナリストやデータ運用スペシャリストの給与より約8,877元高い。職務経験が 3 年未満のデータ アナリストやデータ操作スペシャリストの場合、給与に最も影響を与える要因は勤務地です。北京、杭州、上海、深センのいずれかに勤務する場合、給与は約14,568元に達する可能性がある。他の二級都市、三級都市に設立された場合、給与はわずか9,843元です。

3~5年の職務経験がある職種の給与は高く、3年未満の職務経験がある職種よりも約10,801人民元高くなります。データアナリスト、データ操作スペシャリスト、データマイナーなど、3〜5年の職務経験を持つ職種の場合、勤務地は大きな影響を与えます。北京、上海、深センのデータアナリストとデータ運用スペシャリストの給与は、他の都市よりも約6,146人民元高くなっています。北京のデータマイニング技術者の給与は他の都市よりも約7,765元高い。最も高い給与は、就業経験5年以上の職種で、平均31,919元です。北京、杭州、上海、深センの勤務地で5年以上の職務経験を持つ職種の給与は、他の都市の給与よりも約10,929人民元高くなります。

回帰ツリーの結果から、次の結論を導き出すことができます。

  1. データ関連職種の給与を決定する要素としては、職務経験が最も重要であり、勤務地や職種も重要です。
  2. 職位や勤務経験年数に関係なく、北京、上海、深センで提示される給与は他の都市よりもはるかに高いです。
  3. データマイナーの給与水準は最も高い。職務経験が5年未満の場合、データマイナーの平均給与は、データアナリストやデータ運用スペシャリストよりも約10,000元高くなります。
  4. データアナリストとデータ運用スペシャリストは、職務経験に大きく影響されます。職務経験が増えるにつれて、給与の増加は非常に明白です。
  5. 就業経験5年以上の人の給与は職種による影響は大きくありませんが、勤務地による影響は大きくなっています。

モデルの結果は、個人のキャリア開発の方向性を示すことができます。

  1. 学歴やスキルを向上させ、職務経験を増やし、企業の事業についてより多くの知識と理解を得ることが、応募を成功させるための重要な要素です。
  2. 事前にキャリアプランを立て、さまざまな職種の重点を理解し、的を絞ってスキルを習得します。
  3. あなたの能力の範囲内で、より多くの機会とより良い保証のある大都市と大企業を選択してください。求職においては給与だけを考慮するのではなく、将来の発展も考慮する必要があります。

大学の研修方法については、次のような提案もできます。

  1. 複合的な才能を養う。統計、コンピュータ、データベース、統計ソフトウェアなどの関連コースを提供するとともに、学生のコミュニケーション、表現、チームワークのスキルを訓練する必要があります。
  2. 従来のモデルや方法について語るだけでは不十分で、データ業界の発展のペースに追いつかなければなりません。
  3. 基礎知識や理論的なリテラシーを重視しつつ、実践的な問題を解決できる能力を身につけられるよう、応用力の向上にも力を入れています。
  4. 入学率の向上だけを目標にするのではなく、学生のキャリアプランニングを指導することに重点を置きます。より多くのインターンシップの機会を創出し、インターンシップ中に学生がビジネス知識を蓄積して競争力を高めることを奨励します。

著者: 白昊

この記事はBear Clubから転載されました。

表紙画像はインターネットから取得したものです。違反行為があった場合は削除いたしますのでご連絡ください。

<<:  データ リソースの運用 (データ リソースの入力からエンタープライズ データ資産の運用まで: 専門家が重要な手順と戦略を説明します)

>>:  データ運用スペシャリストの職務内容(南京採用 | Didi Chuxing 採用(事務員/段階的昇給/屋内オフィス))

推薦する

衣料品ブランドのブランド企画(衣料品会社のブランド構築方法)

アパレル企業のブランド構築方法ブランド構築は国内アパレル企業の間ではコンセンサスとなっているものの、...

旅行代理店のマーケティング推進計画(地元ホテルグループの躍進を支える戦略と知恵)

地方ホテルグループの躍進を支える戦略と知恵出典: メイディアン嶺南ホテルの台頭は中国のホテル業界に新...

Windows Server に TeamViewer をインストールするチュートリアル

TemViewe は、リモート サポート、リモート アクセス、オンライン会議のためのオールインワン ...

電子商取引マーケティングプロモーション計画(電子商取引はどのようにマーケティングプロモーションを行うのか)

電子商取引におけるマーケティングプロモーションの実施方法今日では、電子商取引業界はオンラインプロモー...

イベント企画・プロモーション企画(イベント展開企画立案)

活動開発計画立案活動計画立案パート1旧暦の5月5日は、中国の伝統的な祭りである端午の節句です。私の...

高給と成長: データアナリストの選び方

先週の金曜日の夜、友人が私に相談してきました。彼は2つのオファーを受けました: 1つは、年俸40万元...

WordPress ウェブサイトのセキュリティを向上させる方法

WodPess は人気のブログおよび CMS システムであるため、ハッカーの標的になることがよくあり...

磁気タウラスプロモーションプラン(快手磁気タウラス生放送プロモーション広告の作り方の答えはこちら)

快手磁気ゴールデンブルライブ放送プロモーション広告の作り方の答えはここにあります磁気牡牛座が誕生する...

Bethemeはどうですか? Bethemeテーマの機能の紹介

Bethemeはどうですか? Betheme は、ThemeFoest プラットフォームが提供する多...

ブランド マーケティング企業ランキング (Leo Digital は中国科学院のインターネット ウィークリーのデジタル マーケティング企業ランキングでトップを獲得しました)

レオデジタルは中国科学院のインターネットウィークリーのデジタルマーケティング企業ランキングでトップに...

データ分析と運用のどちらが優れているでしょうか? (オペレーションとは何か?離陸に役立つチュートリアル!)

操作とは何ですか?あなたを連れ出すためのチュートリアル!今日は、オペレーションとは何か、そしてそれが...

電子商取引のブランドプロモーション(「デジタルコマースで農業を活性化」が発展の「新たなエンジン」に火をつける)

「農業の繁栄のためのデジタル商取引」が開発の「新たなエンジン」に火をつける地方活性化には産業の繁栄...

インターネット トラフィックの迂回とプロモーションの方法 (インターネット経由でトラフィックを迂回させる最も速い方法は何ですか?)

オンラインプロモーションを通じてトラフィックを引き付ける最も早い方法は何ですか?今日のデジタル時代に...

天猫運営データ(2023年天猫ダブル11報告:全期間の訪問ユーザー総数は8億人を突破)

2023年天猫双11報告:全期間の訪問ユーザー総数は8億人を突破北京ニュース 北科金融(記者 程子...

顧客獲得のための情報フロー広告(情報フロープラットフォームを通じて顧客を獲得する方法)

情報流通プラットフォームを通じて顧客を獲得する方法情報フロープラットフォームを通じて顧客を獲得する方...