データ活用社会の錬金術師、データサイエンティストとは

インターネット上で膨大な量のデータがやり取りされるようになった昨今、さまざまな業界から「データサイエンティスト」と呼ばれる新しい職種に熱い視線が注がれています。
たとえ一つ一つのデータは取るに足らない価値しかなくても、それが集まりビッグデータになると、その中に生活や社会に大きなインパクトをもたらす情報が宿るようになります。
一見、無価値に見えるデータの集まりから、巨額のビジネスを作り出す現代の錬金術師。
それがデータサイエンティストです。
ここでは、データ活用社会で絶大な力を発揮するデータサイエンティストとはどのような職種なのか解説します。
Contents [hide]
21世紀で最もセクシーな職業
データ活用経営の第一人者であるThomas H. Davenportは、世界的ビジネス・マネージメント雑誌のHarvard Business Review 2012年10月号の中で「データサイエンティストは21世紀で最もセクシーな職業」と語っています。
世界の株価時価総額トップ10企業のうち、GoogleやAmazonをはじめとする7社は、日々生まれ続ける莫大なデータをフル活用して利益を生み出す企業です。
人工知能(AI)やIoTなど、近年応用が広がってきたデータの収集と活用を強化する技術の発達で、この潮流は今後もさらに大きなものになっていくことでしょう。
こうしたグローバル企業が競争力の高いビジネスを生み出すうえで、強大な力を発揮しているのがデータサイエンティストです。
彼らは高い価値が眠るデータの在りかを探り出し、それを収集する方法や解析、活用する方法を考えるスペシャリストたちです。
例えば、ネット通販サイトでは購入者の購買履歴や閲覧サイトなどのデータをいかに有効活用するかが、商品の売り上げを大きく左右します。
データサイエンティストは、単なる雑多なデータの集まりであるビッグデータの中から、巨大IT企業の屋台骨を支える価値を発掘している張本人なのですから、「21世紀で最もセクシーな職業」と言われるのもうなずけます。

出典:Cifotart ? stock.adobe.com
企業価値そのものを生み出すデータサイエンティストの役割は重要で、求められる知識とスキルもかなりのハイスペックです。
ただし、相応の報酬と権限が与えられ、それを目指す者にとって魅力的でやりがいのある仕事になっています。
いまやビッグデータの活用は、IT企業だけではなくあらゆる業界の企業にとって最重要課題になりました。
データサイエンティストは、21世紀以降に初めて登場した新しい職種ですが、多種多様な業種の企業がデータサイエンティストを求め始めています。
優秀なデータサイエンティストは希少で、米国などでは企業間の熾烈な獲得競争が起こっています。
データサイエンティストは文字通り“科学者”である
ところで、データサイエンティストという職名には、なぜ「科学者(サイエンティスト)」という言葉が付いているのでしょうか。
それは、データを扱う際の視点が科学的な客観性や実証主義に基づいたものである必要があるからです。
例えば、テストの点数や商品の売り上げなど、皆さんも生活や仕事の中でさまざまな数字を扱う機会は多いことでしょう。
これらの数字から示される意味や結果の考察は多様ですが、よほど気をつけないと主観が入ってしまいます。
「点数は悪いけど、問題が難しかったからみんなも悪いはず」
「思ったより売り上げが少ないが、未集計分を含めれば問題ないだろう」
といった希望的観測などが含まれがちです。
こうしたデータを読み解く際に目を曇らせる主観を排除するため、データサイエンティストは科学者でなければならないのです。
また、データサイエンティストは単なるデータ分析職人でもありません。
既に定まった手法を利用して、正確かつ迅速にデータを分析する作業は、データサイエンティストの業務のごく一部にすぎません。
彼らに本当に求められていることはデータを活用してビジネスの現場で抱えている問題や起きている現象を正確に理解し、それに即した新しいデータ活用法を創出することなのです。
つまり、再現性のある道筋をいち早く見つけ出し、誰もが納得できるアイデアを生み出す役割を担っています。
だから、科学者でなければならないのです。
あらゆる業種の企業を魅了する絶大な力
インターネットを介して、世界中の人々が自由にデータをやり取りできるようになりました。
同時に、ウェブ上での行動履歴やSNSとメールでの会話、やり取りされる映像や動画、取引データや開発データを、簡単にまとめてビッグデータ化できるようになりました。
さらに、あらゆるモノがネットにつながるIoTの時代が到来したことで、サイバーな世界だけでなく、リアルな世界で生まれるデータもビッグデータに加えられつつあります。
米国のIT専門調査会社International Data Corporation(IDC)によると、世界中で生成されるデジタルデータの量は、2013年には年間44兆ギガバイトだったものが、データを扱うシーンが広がったことで20年には440兆ギガバイトと、10倍に膨れ上がるといいます。
しかも、ただ量が増えるだけでなく、集まるデータの質も多様化しています。
これまで、大量のデータを扱っていた業種と言えば、ITサービス業、製造業、金融、小売業、物流などが代表的なものでした。
これが、あらゆるモノがネットにつながるようになり、医療、教育、土木・建設、不動産、農業など、どちらかと言えばITシステムの活用が進んでいなかった分野にも広がっています。
これまでデータサイエンティストは、ネット通販や検索サービス、ゲームや動画の事業者、データ活用社会の到来を見据えたコンサルティング会社やマーケティング会社などが採用と育成を急ぐ企業の中心でした。
今では、ありとあらゆる業種が自社ビジネスの価値向上に向けて、データサイエンティストに注目するようになっています。
特に、電気・ガス・水道といった公共インフラ、物流や公共交通機関、工場や公共施設、プラントなど、複雑なモノの扱いが多い企業や多くの顧客を抱える企業がデータサイエンティストの育成を急いでいます。
取るに足らないデータが価値ある情報に化ける
具体的に、データサイエンティストはどのような仕事をしているのでしょうか。
仕事の内容が最も端的に分かる例、現在多くのネット関連企業内で行われている仕事、さらには今後需要が高まるIoT時代の仕事の3つに分けて、それぞれの内容を紹介したいと思います。

データサイエンティストの仕事の流れ
まずは、IoTやビッグデータ、集合知の威力を示す有名な例での説明です。
日本国中の道路には、日々、大量のクルマが走り回っています。
例えば、すべてのクルマにワイパーが動いているのか、止まっているのかを検知し、そのデータを中央の管理センターに送る仕組みを搭載したとします。
すると、中央管理センターでは日本の中で、雨が降っている場所がリアルタイムで分かります。
この例で重要なことは、ワイパーの動きという単純なデータをたくさん集めることで、全国規模の降雨状況という全く別の価値を持つ情報が得られる点です。
こうした仕組みを企画し、実際に構築する役割を担っているのがデータサイエンティストなのです。
次に、ネット通販サイトの事業者が、ある日の閲覧者数をAIで予測する場合を想定します。
データサイエンティストは、まず、閲覧者数を予測するためにどのようなデータを収集すればよいかを考えます。
過去の閲覧者実績や予測したい月日や曜日、展開中のキャンペーンの有無、その日話題になっているトピックスなどが関係するかもしれません。
こうした収集データの項目を決定し、どのような予測モデルを使えば高精度での予測ができるか考えていきます。
ただし、収集したデータが複数項目にわたる場合、項目同士の関連性が分からず解析が困難となります。
こうしたデータは「非構造化データ」と呼ばれます。
データサイエンティストは、非構造化データ関連性を見つけ、平均値や偏差値など統計処理や単位の換算や表現の変換、足りない部分を補うといった加工などをしながら結び付け(構造化)、データを解析します。
その後、解析結果として得た閲覧者数の予測を可視化し、評価して閲覧者数を増やすための対応策などを考えます。

出典:illumate ? stock.adobe.com
リアルな世界のデータはきれいなものばかりではない
最後に、工場内の工作機に振動センサーを取り付け、振動の変化から故障が起きる予兆を察知するIoTシステムを想定した例です。
この事例も、ネット通販サイトの閲覧者予測で行っていたような、データ収集、加工・修正、集計・解析、見える化や問題解決法の起案といった作業を行う点は同じです。
異なる点は、リアルな世界からデータを収集するからこそ必要になる作業があることです。
例えば、工作機の故障の予兆を察知するため、どのようなセンサーをどこに何個取り付ければデータを取得できるか考える必要があります。
さらに、工場内には故障予知の対象となる工作機以外にも多くの振動源があることでしょう。
このため、正しいデータを取得するためには、ノイズを取り除く方法も考えなければなりません。
IoTで扱うのはただのビックデータではなく、ビッグアナログデータである場合がほとんどです。
また振動センサーは、振動のデータは検知しますが、データ取得した時刻は出力しません。
振動の変化や、複数のセンサーで得たデータの関連性を見るためには、データにタイムスタンプを押しておく必要があります。
こうした、予測に必要なデータをそろえる方法を考えることも、データサイエンティストの仕事になります。
データサイエンティストは、新しい職種です。
このため、現時点で資格制度などは存在せず、各企業は、大学院を修了した高度な専門知識を持つ人材を対象にして、現場で実務経験を積みながら育成している状態です。
資格がないため自称することもできますが、データサイエンティストを求める企業は豊富な実務経験を何より重視しているため、簡単には採用されません。
近年、データサイエンティストに必要な知識を体系的に教える講座を開設する大学もできてきており、滋賀大学のようにはデータサイエンス学部を作った大学も登場しています。
さらに、データ活用社会の要請に応える人材の育成とその活用を狙って、2013年に初の業界団体データサイエンティスト協会も設立されました。
要求される知見とスキルは、極めて高いのですが、データサイエンティストの重要性と将来性は疑いようがありません。
意欲のある方は、挑戦してみてはいかがでしょうか。