時代の要請に応える新職種、データサイエンティストに必要なスキルとは
一見無価値に見える莫大なデータの山をビジネスやサービスに活用し、巨額の利益を生み出すデータサイエンティスト。
データの有効活用があらゆる企業にとっての経営課題となる時代が到来したことで、彼らは多くの企業から引く手あまたの存在となっています。
当然、その将来性は高く、憧れを持つ人も多いのですが、データサイエンティストの力を身に付けるためには多様で高度なスキルが求められます。
ここでは、その魔法のような力を取得するためにはどのようなスキルを養う必要があるのか解説します。
Contents [hide]
データサイエンティストに求められる3つのスキル
昨今はいかにデータを活用するかがビジネスの価値や社会活動の効率を大きく左右するようになりました。
データの収集から加工、解析、活用に至るまでの方法をまとめて考えるデータサイエンティストは、まさにその成功の鍵を握る重要な職種です。
求められる知識やスキルは極めて高度で、しかも広範な分野にわたります。
まさに、現代の“スーパーマン”といった感じさえします。
データサイエンティスト協会は、データサイエンティストに求められるスキルとして、以下の3つを挙げています(図1)。
(1) ビジネス課題を理解・整理して解決法を探る「ビジネス力」
(2) 情報処理や統計学などの知識を駆使してデータを自在に操る「データサイエンス力」
(3) 解析結果をビジネスに活用できるようにして実装・運用する「データエンジニアリング力」
データサイエンティスト協会は、これら3つのスキルのうち、どの1つが欠けてもいけないと定義しています。
データサイエンティストというと数字を読み解くというイメージから理系を思い浮かべるかもしれませんが、ビジネス力は特に理系や文系の能力を横断するスキルです。
全てを兼ね備える人材は総じてとても優秀だと言えるでしょう。
これら3つをいきなり1人が兼ね備えることは、極めて難しいことです。
ひとまず、こうした全てを兼ね備えるデータサイエンティストは、目指すべき理想像と考えてみてください。
まずは、どれか1つで他のデータサイエンティストに負けない自分だけの強みを作り、実務経験を積みながら徐々に他のスキルを埋め、高めていくのが、無理のないステップアップのプランとなるでしょう。
また、データサイエンティストという、いかにも理系の職種名ですが、求められるスキルの中に文系のスキルも含まれる点は注目できます。
プログラミングや統計処理など理系の知識やスキルを身に着けていく意欲があれば、文系の学生がデータサイエンティストに挑戦することも可能です。
経営者目線、現場目線で課題を理解
データサイエンティストに求められる「ビジネス力」とは、ビジネス上の課題を経営者目線または現場目線で理解し、複雑な課題を整理しながら解決していく力のことを指します(図2)。
実は、ビジネス上の課題を明確に意識している経営者はそれほどいません。
「利益率を高めたい」「新規顧客を増やしたい」「ブランド力を高めたい」といった、かなりふんわりとした問題意識だけ持つことがほとんどです。
また、各事業部が持つ問題意識も同様で、「新製品を出したのに、なぜか顧客に響いていないようだ」「クレームが増えているような気がする」「生産ラインの部品在庫が貯まりすぎている」というように、課題が漠然としているため、解決策が見いだせないというケースがビジネスの最前線で多く見られます。
こうした不明瞭な問題意識を、データサイエンスで解決すべき明確な課題に焼き直すスキルが、データサイエンティストには欠かせません。
ビジネスの現場で実際に起きていることを理解し、解決法の糸口となる明確な課題の仮説を立て、その検証手段を考え、さらに客観的かつ論理的に現状分析していく力が求められます。
例えば、「遊園地の売り上げを伸ばしたい」という課題があったとします。
データサイエンティストは、データから現状を検証し、解決の糸口を探るために、まず現在の売り上げを決めている要因を細かく分解します。
売り上げは、延べ来場者数と入場料で決まります。
このうち、延べ来場者数は、一見の来場者数と延べリピート来場者の数に分解できます。
さらに延べリピート来場者数は、来場頻度とリピーターの数の掛け算で表すことができます。
こうして要因を分解したデータを実際に収集すると、「リピーターの来場頻度が落ちてきているから、新鮮なイベントを開催したらどうか」といったデータの裏付けのある対応策が見えてきます。
データを自在に操る最低限の技術力は必須
データサイエンティストに求められる「データサイエンス力」とは、データを質と意味を理解して解析可能な形に整理し、解析して価値ある情報を抽出する力のことを指します(図3)。
こうした作業には、情報処理、人工知能、統計学など情報科学系の最低限の知識が要求されます。
これまでのデータ分析の仕事の中心は、解析した結果をレポートする業務でした。
一方、データサイエンティストにはビジネス課題を解決するための予測モデルの作成が求められます。
そして、その予測モデルは一度作成してしまえば専門的知識がなくても分析できる、またはITシステム化して自動分析できる状態であることが必要です。
こうした要求に応えるためには、かなり専門性の高い統計処理、解析技術が必要になります。
例えば、ビッグデータから価値ある情報を取り出すデータマイニングと呼ぶ作業では、「Python」や「R」「MATLAB」などプログラミング言語を使ってプログラムするスキルが欠かせません。
また、大規模なデータベースを構築・活用するためには、フレームワークである「Hadoop」やプログラミング手法の「MapReduce」、プログラミング言語の「Java」や「Hive」などを扱うスキルが必要になってきます。
ただし、プログラミングは、データサイエンティストにとっては、あくまでもビッグデータの中から価値ある情報を取り出すための手段。
高度なプログラミングスキルの取得を目指すよりも、他のスキルを補う方が、ステップアップを目指すうえで、より効果的な場合が多いようです。
その他にも、最近では機械学習や深層学習(ディープラーニング)などのデータに潜む傾向を高精度であぶりだすAI技術の活用に注目が集まっています。
この分野の知識やスキルが高い人材への需要が高まっています。
現場固有の状況を熟知し、現場が求めることに寄り添う力
データサイエンティストに求められる「データエンジニアリング力」とは、データを適切に収集したり、データを解析した結果を活用して具体的なサービスや処理を作り出したりする力を指します(図4)。
データをどこからどのように収集するかは、最終的に得られる解析結果の質を大きく左右します。
特にリアルな世界から各種センサーを使ってデータを収集するIoTシステムでは、さらにその傾向が高まります。
というのも、目的に合ったセンサーを選定し、適切な位置に取り付け、必要な情報が得られる頻度でデータを収集する必要があるからです。
リアル世界から適切なデータを得るためには、データを収集する現場で起きているさまざまな現象を理解する専門知識が必要になります。
例えば、工場の製造装置からデータを得るには工場自体の動作原理を、農業で田畑からデータを得るには作物の生育に影響する環境要因を、橋の老朽化を測るには劣化しやすい場所とそこで起きる現象を理解しなければなりません。
また、解析した結果を現場で生かす際には、「人手に頼っていた作業の自動化」や「現場の異常を察知したときのアラート発信方法」など、解決すべき課題に即した対処が欠かせません。
適切な対処法を考えるためにも、現場をよく理解している必要があるのです。
こうした現場の理解が重要になることは、データサイエンティストになるキャリアパスの起点が多様化するということでもあります。
生産技術や農業、土木工事の専門家が、いずれはデータサイエンティストになる可能性があるのです。
優れたデータサイエンティストになるには戦略が必要
データサイエンティストには、他の業種には見られないほど、広範な知識とスキルが求められます。
最近では、育成講座が開講され、データサイエンティストのスキルを体系的に勉強できる環境が少しずつ整いつつあります。
とはいえ、新しい職種でもあり、しかも求められるスキルの水準が高いことから、弁護士や税理士、プログラマーなどに比べると勉強を支援する環境が十分整っているとは言えません。
ただし、データサイエンティストを目指す人は、こうした状況を悲観する必要はありません。
自分できっちりとした勉強の戦略を立て、段階的にキャリアを積んでいけば、先行者利益を得やすい状況だと見ることもできるでしょう。
データサイエンティストの仕事は、一見、数字の羅列にしか見えないデータから、想像力を膨らませて、そこに内在する価値ある情報を見つけ出す面白い仕事です。
時刻表を見て列車の運行や日本各地の地域性に想いをはせる鉄道マニアと似た面があります。
手ごたえのある職種ですが、挑戦のしがいと面白さは折り紙付きだと言えるでしょう。