【需要急上昇!?】なぜ今データサイエンティストが注目されているのか【アメリカでベストジョブ】

グローバルでAI開発者・データサイエンティストを目指す人向け
おすすめUdemy講座一覧

TOEIC300→海外就職の英語勉強法まとめ

目次

データサイエンティストがアメリカでBest Job

なにかと最近話題ですよね.

先日Glassdoorが発表した50 Best Jobs in America for 2019 Data ScientistがBest Job1位と発表されました.

なんで??

Salaryの中央値を見ると$108k(1千万超え).これ本当なの??

今日はこの辺について話していこうと思います.

結論から言うと

  • 5G・人工知能ブーム・IoT・量子コンピュータなどの技術革新で世界中データで溢れかえる未来(すでに溢れかえってますが)が来て,これからの時代はそのデータを上手く活かせる企業が生き残る.そこにデータサイエンティストが必須でめちゃくちゃく需要があり超高待遇の上サイエンスが好きなら楽しく続けられるからだと思う.
  • アメリカは都市によって物価(特に家賃)が様々で,場所によって給料が全然違うのでアメリカ全体の給与中央値はあてにならない.が,私の感覚でいうと$108kは低い.私の会社では新卒が$130k~$140kあたり.

データサイエンティストってなに?

データサイエンティストは,統計学や機械学習などの計量化学を使用して現実世界のデータ(Real World Data)を分析し,その分析結果をビジネスに活用したり,プログラミングを駆使してソフトウェアを開発したりする人たちのことです.

例えば以下のような職業は多くの企業でData Scientistとして募集されることが多いです.

データサイエンティストの例

  • 顧客データや市場データを分析し,マーケティングに活かしたりビジネス方針を提案をする.
  • Siriの音声認識やiphoneの顔認証などの人工知能を開発する.
  • ある国の消費者データを分析してスラム街を特定する.
  • 電子カルテの情報を分析して患者の予後を予測する.

つまり,データに対して正しい知識で分析してそれで何かの課題を解決することがデータサイエンスであり,それを実行する人がデータサイエンティストです.

ここでいう「正しい知識」というのが統計学や機械学習などの知識です.なんとなくエクセルでグラフを作って,「過去10年で毎年だいたい10%ユーザ数が上がっているのでおそらく来年も10%くらいはユーザが増えると思います」というのはデータサイエンスではありません.これを統計学を用いて論理的に理論にそって説明するのがデータサイエンスです.

データサイエンティストが注目される理由

なぜ今こんなにも注目されているのか.

一つは2012年に深層学習という技術革新により,人工知能ブームが来て様々な企業が深層学習を使用したサービスをこぞって開発し,実際にAlexaやGoogle翻訳,Siri,iphoneの顔認証などが人々の生活を変えてきていることが挙げられます.

深層学習について簡単に説明すると,2012年にImageNet Large Scale Visual Recognition Challenge (ILSVRC) という画像認識の世界大会でトロント大学のヒントン教授率いるチームが,他のチームを圧倒して高精度を叩き出したことに始まります.

深層学習を開発したヒントン教授.今やGoogleの副社長を勤め,2019年にはチューリング賞を受賞

今ではこの技術が画像認識,音声認識,自然言語処理と様々な分野で応用され,実際にAlexaやSiriといったAI機器に使われています.

この深層学習を使って製品を開発する職業もデータサイエンティストです.私も仕事でよく使います.

...と.ここまでがよくある「データサイエンスが流行った理由説」なんですが,ここではもっと深く,先を見据えた内容を書いていきたいと思います.(深層学習についても別途記事を書いていこうと思います.)

データは資産.データを制するものが勝者の時代に

まずは時を遡ること1960年代後半,インターネットの中核的技術であるパケット交換(データを送付する際に小包(パケット)にわけ,受ける際にそれを紐解いて受けとるという技術)の発表をもとに,米国の大学を中心にパケット交換方式の通信実験が開始され,ARPANETという現在のインターネットの起源ともいえるネットワークが作られました.

当時は本当に一部の人たちしかこの技術を使わなかったそうですが,時が経つこと1977年,アップル社がPersonal Computerを発売(AppleⅡ)しそれと同時に徐々に世界中でインターネットが普及していきます.

この当時,ほとんどの人が気づかなかったことがあります.

それは,インターネット上でやりとりされているデータはなににも代え難い資産であるということ.

え?インターネット上のデータ?なんでそれが資産になるの??

これに気づかないとデータサイエンスの本当の価値というのはわからないと思います.これがまさに今,そしてこれからさらにデータサイエンティストとう職業が重宝される理由なのです.

データを極めて成功した企業たち

まずはデータサイエンスの申し子ともいえる企業がGoogleです.

Googleはもともと,当時スタンフォード大学の大学院生だったラリー・ペイジが在学中に研究したWebの検索アルゴリズムが元となって,1998年に企業した会社です.今では当たり前の検索エンジンで,みなさんも検索エンジンの重要性はご存知だと思います.

Google創業者ラリー・ペイジ(左)とセルゲイ・ブリン(右)

みなさんもググった結果が自分の欲しい内容と違ってたらいやですよね?

しかし,実は当時検索アルゴリズムはあまり重要視されていませんでした.当時の検索アルゴリズムは,簡単にいうと

検索キーワードを多く含んでいるページが上位に表示される

仕組みになっていました.つまりめっちゃ適当な文章でも,その内容に無駄にキーワードを含んでいたらそのページがトップにくると.

そこでラリー・ペイジは

他のページからリンクされているWebページは質が高い

として,それをもとにWebページを点数化しランク化したのです.

ちなみにこれは,「引用数が高い論文の質が高い」ことからヒントを得たそうです.なんだか当たり前なことですよね.

私の大学院時代の先生がスタンフォード大学の教授を訪問した時に「今すごく面白いことを研究している学生がいるから会ってくれ」と,当時まだ大学院生だったラリー・ページから研究内容を聞いたそうです.そして「今色々な教授陣が彼に投資しようとしている」と言われましたが,先生には研究の面白さが全くわからなかったそうです笑 もしここで投資していたら,今頃億万長者だったでしょうね笑

まぁ当時は,検索エンジンの重要性は世間ではさほど重要視されてなかったんです.

実はこの検索エンジンというのは,データサイエンスの塊のようなもので,つまりラリー・ペイジはこの時からデータの重要性に気づいていて,「世界中の情報を整理して世界中の人たちがそれにアクセスできるようにする」という使命のもと1の後ろに0が100個ならんだ単位の「Googol」という用語を文字ってGoogleを立ち上げたのです.

Googleがいかにして今世界を代えたかはみなさんの通りです.Google Map, gmail, Youtube, Androidなど,今ではなくては生活できないという人も多いのではないかと思います.

今や超優秀なAI研究者やデータサイエンティスト,エンジニアを大量に採用し,既存サービスや自動運転,医療診断AIなどの未来のプロダクトに投資しています.

深層学習を提案した一人のトロント大学ヒントン教授とその学生たちも今やGoogleの元で働いています.

実は1990年代に生まれたIT企業で今や時価総額のトップに並ぶ企業はどれもデータサイエンスを超重要視してます.

例えばAmazon

Amazonといえばみなさんおなじみのネット通販会社ですが,実はこのAmazonもデータサイエンスを大いに活用してここまで大きくなりました.

え?あまりそんなイメージない??

と,言われそうなのでAmazonを例にとってみました笑

Amazonはジェフ・ベゾスが1994年に設立した会社ですが,当時「腐らない」「価値が落ちない」「形がどれも近い(つまり多様な梱包が不要)」などの理由からインターネットで売るのに最も適している商品として本を売り始めたところから始まります.

Amazon創業者 ジェフ・ベゾス

実はAmazonは本当にデータを大事にしていたと言われていて,Amazonでは,全てのランキング(Top10とかではなくTop1000とかまで)が見えるように全部データで順位をつけたり,レビュー機能をつけて消費者の正確で正直なデータを全て公開したり(当時はかなり批判もあったようです.),ユーザの購買・閲覧行動履歴と他のユーザの購買履歴を元に,そのユーザにあったおすすめの商品を提示したり(これは裏では機械学習の鬼ともいえるようなアルゴリズムが走ってます.)と,Amazonはきちんとデータに向き合うことで企業価値を高めていきました.

あげればキリがないんですが,なにが言いたいかというと

データを制するものが勝つ世界

が現状であるということ.これは間違いありません.断言します.

インターネット初期のころにこれに気づいていた企業が今生き残っているのです.

これをわかっている大手IT起業(GAFAなど)はデータの囲い込みに必死ですよね.Amazonもクラウドコンピューティングの分野でAWSという会社を作って圧倒的なシェアを誇っています.つまり,いろんな会社のデータは実は今Amazonの手元にあると・・・

Facebookも,インスタグラムを始めとする様々なSNS群で世界中(ユーザは20億人にも及ぶようです.)のデータを吸い取っています.

Netflixもユーザーの視聴履歴とプロファイルを集め,キャスティングをAIで判定していると聞きます.

日本の会社をみても,最近みられるQRコード決済や楽天経済圏など,各社データの囲い込みに必須です.

なぜなら,データそのものが資産だから.

そしてそのデータをいかに活かすかがデータサイエンティストなのです.

もはや今の時代,データサイエンスが会社の命運を分け,いかに優秀なデータサイエンティストを雇うかというのが非常に重要なのです.

アメリカの会社はまさに今いかに効率よくデータを集め,それを活かし優位にたつかというのに必死です.そのため,データサイエンティストの年収が高騰しているのです.

これからさらにデータサイエンスの重要性は上がる

ここまで聞くとデータサイエンスが今非常に重要なのはわかってもらえたかもしれませんが,

「それって,今まではインターネットがでてきてパソコンがでてきて,スマホがでてきてデータ急上昇期だったけど,これからはもうそんなに増えないんじゃない??」

という質問が聞こえてきそうですが,

これは大きな間違いでそう思っているとこれからの時代本当に生き残れない

です.

その理由はこれから迫り来るAI時代,5GそしてIoTが関係します.

簡単にいうとこれからは物と物とがつなっがてくIoT時代に突入します.

これによりデータは爆発的に増えます.(今までは人と人が繋がる程度だったのがモノも繋がることで爆発的にデータが増えます.)

これについてはまた改めて記事を書きたいと思います.

(追記)こちらに記事書きました!→【迫り来るデータ時代】データサイエンスが未来を作る【5Gが世界を激変】

また,よく話題になるデータサイエンティストの年収についても別途記事にしたいと思います.

長くなってしまったので,今日はこれで.