web系に関わる情報を 専門家が毎日発信!

データサイエンティストを完全独学で目指すのは無謀【経歴別に解説】

 

先ほどこんなツイートをしましたが、データサイエンティストになりたいけど、独学でなれるのかを考えてみたいと思います。結論、完全独学は厳しいと思います。今回は、経歴ごとに独学でどこまで目指せそうかを考えてみます。

 

この記事の信頼性ですが、僕は大学院からネットワーク解析を使った研究をしていて、データサイエンスを少しは分かるのと、データサイエンティストな方々とも働くことがあるので、どういう経歴だと独学でどのレベルまで行けそうで、でもどんなことが課題として残るかを考えたいと思います。

 

データサイエンティストを完全独学で目指すのは流石に厳しい

 

データサイエンティストに独学でなれるかどうかを論じるには、データサイエンティストというふんわりとした職名をスキルの種類と深さで定義する必要はあるのですが、まず結論いうと巷で言われているデータサイエンティストには完全独学でなるのは厳しいです。

 

データサイエンティストとは、さまざまな意思決定の局面において、データにもとづいて合理的な判断を行えるように意思決定者をサポートする職務またはそれを行う人のことです。 統計解析やITのスキルに加えて、ビジネスや市場トレンドなど幅広い知識が求められます。
引用:データサイエンティストとは

 

それらの理由を、僕なりに分解すると、アカデミックな知識や技術のバックグラウンドが前提となっているということと、内容が難易度高いということに集約されるかなと思います。

 

基本的に大学などで専門性を高めるのが前提

まず1つ目は、データサイエンティストの行う仕事は、バックグラウンドとして大学で習うような高度な統計知識やコンピュータサイエンスなどの知識がそもそも問われるということですね。これ言うなれば、データサイエンティストに独学でなるのって、そもそも大学の授業を独学で習得できる?という問いに近いです。

 

流石に無理だと、この時点で気づかれると思います。ざっと、データサイエンティストになるために必要となる知識を並べると、下記の通りです。

 

数学
 ・確率統計
 ・線形代数親和性のある学問
 ・計量掲載学
 ・物理学
 ・コンピュータサイエンスプログラミング言語
 ・R
 ・Python

 

どうでしょう?これを見ると、データサイエンティストになりたい場合は、そもそもいずれか近いしい学問を学べる専攻にいないとそもそも不利なことが分かるかと思います。

内容が難易度高い

またデータサイエンティストに独学でなるのが厳しい理由の2つ目として、そもそも1つ1つの習得レベルが難しくて、個人で独学して習得できるのは限られた層(自分で習得できても浅いレベルのことが多い)だと思います。

 

そもそも多くのデータサイエンティストになっている方々は、アカデミック分野でも努力されてきている人ばかりですし、どれを独学でなんとかするのは、いわゆるデータサイエンティストを例えば新卒で目指す上では難しいのは明白です。

 

しかし、後述しますが、理由によってデータサイエンスを学べる専攻やスクールに行けないけど、最終的にはデータサイエンティストになりたいという方は、遠回りですが目指せる道もあるかと思い、ページの最後の方に解説してます。

 

僕がデータサイエンティスト目指してネットワーク解析していた2年間

 

ちなみに僕もデータサイエンティスト目指して、大学院時代は研究していました。ネットワーク解析というエッジとノードでグラフを表現する解析手法でして、主に人間のつながりだとか社会科学分野で用いられます。

 

僕の場合は、研究者が論文で一緒に研究することがあるんですが(共著と呼ぶ)、その共著関係をネットワーク分析で可視化して、どういった研究分野がどういった研究分野通しでネットワークされ、インパクトファクターと呼ばれる論文の1つの成果指標のような被引用回数に影響するか、また企業内がどのように重要研究分野を共著しているのか、を研究していました。

 

ネットワーク分析とは、現実世界に存在する巨大で複雑なネットワークの性質について分析することを指す,
引用:ネットワーク解析とは

 

この時思っていたのは、データサイエンス難しすぎるということと、研究室に通いながら研究するのでも大変なのに独学は被現実的だなと思ったのを覚えています。それで就職は、UXデザインの分野に変更しました。

 

ネットワーク解析だけでも結構奥深いのに、データサイエンティストはそのような解析手法をその10倍以上も持ち合わせるわけなので、相当な勉強量が必須になります。

 

データサイエンティストを極力独学で目指す経歴別方法

 

では、今回の主題であるデータサイエンティストを極力独学で目指す経歴別方法を事業会社の中でデータサイエンティストと共に働いている目線で考えていきたいと思います。大きくは、大学生と社会人で分けられます。

 

大学生の場合

大学生がデータサイエンティストを目指す場合は、すでに大学でデータサイエンスと親和性の高い分野を専攻している場合と、そうでない場合で分けられます。

 

大学で親和性の高い分野を専攻

大学でデータサイエンスと親和性の高い分野を専攻している場合ですが、ここでは親和性の高い学問として、計量経済学、コンピュータサイエンス、そして物理学を一例としてあげてみます。これらの学問では、統計モデルを作ったり、プログラミングなどデータサイエンティストとして必要なスキルを部分的にも学ぶことが可能です。スキルの全体観は、下記で詳細に解説しています。

 

参考:データサイエンティストに必要なスキル【事業会社目線で解説】

 

こういった専攻で既に学んでいる場合が、一番データサイエンティストになりやすくて、専攻での授業や研究を頑張りながら、就職活動すれば十分に戦えるかと思います。ただ、データサイエンティストを目指す就活生はかなりスキルレベルも高めで優秀な人材が多い印象があるので、少しでも確度を高めたい場合は、データサイエンティスト育成スクールに通うことも視野に入れてもいいかもしれません。

 

でも僕の肌感では、内定を得ている人たちの多くは必ずしも通ってないことの方が多そうです。それよりも研究でアウトプットを出す方がいいかもしれません。

 

大学とは別でデータサイエンススクールを受講

 

大学ではデータサイエンスに親和性の高い専攻や学部ではない場合は、転部などを考える余地があります。ただもうそんなこといってられる段階ではない場合は、もうデータサイエンティスト育成スクールを別途受講するのが唯一の近道かと思います。

 

エンジニアなどであれば、プログラミングを独学で学びつつも、インターンやアルバイトなどでエンジニアとしてスキルアップしていくという方法もありますが、データサイエンティストの場合はそういうアルバイトやインターンも少ないですし、インターンでさえもある程度スキルがないと採用されそうにありません。(そもそも育成コストが高すぎる)

 

なので、この経歴の場合は、データサイエンティストを目指すに当たって独学だけでは厳しいので、データサイエンティスト育成スクールを選択肢に入れるのは現実的です。それか、下記のようにデータサイエンティストに親和性の高いキャリアとして一旦社会人になってから、徐々に狙っていくという方法も考えられますが、遠回り感は否めないですね。

 

社会人の場合

社会人の場合ですと、エンジニア、コンサルタント、アナリティクスディレクターが、データサイエンティストに転身可能性のある職種として大別されます。これは、データサイエンティストの職能を考えると明白です。

 

データサイエンティストの必要スキル近しい職種
データサイエンスアナリティクスディレクター
エンジニアリングエンジニア
ビジネスコンサルタント

 

エンジニア

まずエンジニアですが、エンジニアの中でも、データサイエンティストに親和性の高いSQLを多用するようなDBエンジニアが最も近しい存在ですね。また、エンジニアの時点でプログラミングに関する素養とスキルはあるはずなので、それを武器というか軸にしてデータサイエンティストを目指す展開が考えられます。

 

エンジニアの場合には、データサイエンススキルとビジネススキルが不足していることになりますが、データサイエンススクールに通うか、あるいは企業内でデータ分析部門に異動するという方法が現実的です。ビジネス観点は結構個人のセンスというかロジカルシンキングにもよるので、優先度高いのはデータサイエンススキルでしょう。

 

コンサルタント

コンサルタントの場合は、ロジカルシンキングを武器にしてデータサイエンティストを目指すのがいいかと思います。コンサルタントにも色々ありますが、基本的にはビジネススキルは高いはずなので、エンジニアと同じくデータサイエンス育成スクールに通うか、あるいはプログラミングを独学でまずは始めるでもいいかと思います。

 

データサイエンティストに多用されるプログラミング言語は、RかPythonでして、Pythonに関しては、下記でも解説しています。

 

参考:pythonでデータサイエンスを学ぶ方法【まずは本でOK】

 

アナリティクスディレクター

次にアナリティクスディレクターですね。アナリティクスディレクターとは、アクセス解析やSQLでデータ解析を行いビジネス課題を解決する職種なので、ビジネスと多少のデータサイエンスのスキルが求められる職種です。

 

人によっては、アナリティクスディレクターでも楽しいと思えるでしょうし、データサイエンティストじゃなくてもいいかもと思う場合もあるので大学生や就活生は一考の余地はありそうです。データサイエンティストとのギャップは、統計モデルを作成するとか、高度のプログラミングを行えるとかがメインになるので、データサイエンティスト育成スクールに通うと最速でなれそうな気もします。

 

データサイエンティストになるための共通課題は社会実装

 

先ほど経歴ごとにデータサイエンティストになるための選択肢をいくつかあげましたが、データサイエンティストになって活躍する上でどの経歴やキャリアでも共通して課題となるのは、社会実装におけるスキルです。

 

何かと言うと、多くのデータサイエンティストは研究など理論ベースでの方法論を学んで、そういったスキルを武器にデータサイエンティストになるわけですが、ビジネスの世界でデータサイエンススキルを武器にして活躍する場合には、課題設定スキル(ビジネススキル)とどう社会実装するか、に苦心するケースが多いです。

 

例えばですが、課題設定スキルでいうと、なんでもいいからデータサイエンスで解決すれば言い訳ではなく、そもそも重要な課題じゃないものを解決しても無意味ですし、データサイエンスで解決するのがベストな選択肢とも限りません。この辺の嗅覚をつけるのは実際に働きながらじゃないと難しいです。

 

また、社会実装の観点で言うと、理論的には素晴らしいソリューションであっても、使う人たちが使いこなせないと意味ないですし、受け入れられないと作った意味もありません。この辺もどういったことを意識するといいのかと言う点もデータサイエンティストになる上では、重要ですが独学では学べないです。

 

ただ安心して欲しいのは、ほぼ多くのデータサイエンティストも新卒の段階では、こういったスキルには課題を残したまま徐々に成長するのが普通なので、こう言う課題も出てくると覚えておけばOKかと思います。

 

データサイエンティストの独学に終わりはない

 

ちなみに、データサイエンティストは技術進化も起こりますし、トレンドの変化も強いので、社会人として働きながらも、大学院で学び続ける人も大勢います。

 

社会人でも大学院に行きながら働くのが普通

 

知り合いのデータサイエンティストでも、働きながら博士課程に進学している人も多いですし、もはやデータサイエンティストの勉強や独学に終わりはありません。実務で得られるスキルとアカデミックな世界で得られるスキルは別物です。

 

Kaggleなどコンペもたくさんある

他にもKaggleなどデータサイエンスの分野でコンペもありますので、独学というか個人でのアウトプットとしてデータサイエンスを学び続けるという姿勢は必要になり続けます。どの職種でもそうですが、特にデータサイエンティストは勉強を継続する姿勢が必須です。

 

まとめ

ということで、データサイエンティストを独学で目指せるのか、経歴別でどう極力独学しつつ目指せるかなどを書いてみました。これから、データサイエンティストになりたい方々は独学しつつも現実的にどうやってデータサイエンティストになれるかは個人個人のキャリア設計と共に描かないとなれなかったということにならないといいですね。

 

参考:データサイエンススクール厳選3社【現状スキルに合わせた選び方も解説】

最新情報をチェックしよう!