あこがれのデータサイエンティストになるための資格とは
データ活用社会の寵児と呼べるデータサイエンティストの採用を、多くの業界・業種の企業が急いでいます。
しかも、好待遇での求人が多いため、あこがれている人も多いのではないでしょうか。
現時点でデータサイエンティストを名乗るのに、特定の資格を取得する必要はありません。
ただし、各企業が求める知識とスキルは、極めて高度かつ広範囲にわたり、稼げるデータサイエンティストになるためには相応の自己研鑽と実務経験の蓄積が求められます。
ここでは、これからデータサイエンティストを目指す方に向けて、知識やスキルの素地作りをするために活用できる資格を紹介します。
Contents [hide]
誰でも名乗れるが誰でも稼げるわけではない
データサイエンティストは名乗ろうと思えば誰でも名乗ることができますが、採用する企業側がデータサイエンティストに求める知識やスキルは極めて高レベルです。
そのため、まずデータサイエンティストとして一定レベル以上の力を持っていることを端的に証明できればキャリア形成に有利です。
具体的にはITシステム、プログラミング、統計学、データベース、機械学習などに関連した情報処理系の資格や認定を取得していれば確実に武器になります。
また、企業の中で重用され、稼げる人材になるためには、自己研鑽と実務経験の蓄積の両方が必要です。
このうち自己研鑽の手段として資格試験に挑戦することは、必要な知識を網羅的に得ることができ、モチベーションを高めてくれることでしょう。
ここからは、データサイエンティストとしての素地作り、またスキルアップに有効な資格や認定試験を紹介します。
必須科目、統計を体系的に学べる「統計検定」
データの解析作業に、統計の知識は欠かせません。
統計は、データサイエンティストだけでなく、エンジニアやアナリスト、マーケッターなど多くの職種の業務で強力な武器となる知識です。
ところが、高校や大学時代に数学が得意だった人でも統計の知識は意外と乏しく、実際の業務で苦労する場面があります。
統計についての学び直しと学習のモチベーションを維持するために最適な認定試験が統計検定です。
「統計検定」は、統計に関する知識や活用力を評価する日本統計学会認定、総務省などが後援する全国統一試験です。
中高生でも挑戦可能な基礎的知識を問うレベルから、データ分析の専門職に向けた幅広い知識と応用力を問うレベルまで、各レベルに応じた能力が問われます。
その中でも2級は大学基礎統計学の知識と問題解決力、準1級はデータサイエンスの基礎となる統計学の活用力、そして1級は実社会のさまざまな分野でのデータ解析を遂行する統計専門力を認定しています。
データサイエンティストを目指す人は、まず2級以上の取得を目指して勉強してみることをおすすめします。
2級の試験では、以下の内容が問われます。
- 現状に潜む問題を見つけ出し、それを解決するためのデータを収集する力
- 収集したデータを基にして仮説の構築と検証を行う統計力
- 新しい知見を獲得するための切り口を見つけ出す力
4~5択の選択肢が用意されたマークシート方式の試験で、約35問を90分で解答します。
準1級では、実社会のさまざまな問題に対して適切な統計学の手法を応用できる能力を問う内容です。
マークシート方式の選択問題に加え、5~10問の部分記述問題、3問中1問を選択し、論じる論述問題に120分で取り組みます。
そして、1級は「統計数理」と「統計応用」の2つの論述式の試験から構成されており、大学での専門分野修了に相当する高いレベルの試験となっています。
統計数理は全5問の中から3問を選択。統計応用は、人文科学、社会科学、理工学、医薬生物学の中から1つを選択して受験します。
統計数理と統計応用のそれぞれに合否判定があり、個別に合格証が発行されます。
ただし、両方の試験に合格しなければ統計検定1級の認定は得られません。
ITシステムの関する知識を認定する「情報処理技術者試験」
ITシステムの構築と運用、管理に向けた知識やスキルを認定する試験として、情報処理推進機構(IPA)が実施する国家試験「情報処理技術者試験」があります。
この試験はシステムエンジニア(SE)にとっては必須ですが、データサイエンティストを目指す人にも有用です。
資格取得を目指す勉強を進める中で、ITシステムに関する知識を網羅的に取得できることでしょう。
情報処理技術者試験には、極めて基本的な知識を問うものから、細分化した専門性を問うものまでさまざまな試験があります。
データサイエンティストを目指す人は、このうちエンジニア向けの基礎的スキルを問う「基本情報技術者試験(FE)」から挑戦し、次により高い知識と応用力を問う「応用情報技術者試験(AP)」の取得を目指すのが良いでしょう。
FEはすべて選択式の試験で、APは選択式に加え記述式の試験も課されます。
データベースを操る力を認定する「オラクルマスター」と「OSS-DB技術者認定試験」
データサイエンティストが解析するデータは多くの場合、データベースの中に蓄積されており、必要なデータの抽出や効率的な解析が必要です。
このため、データベースを自由自在に使いこなせる知識が必要になってきます。
ただし、最新のリレーショナルデータベースを使いこなすには、その構築と運用、保守、管理を行うデータベース管理システム「DBMS(Data Base Management System)」に関する知識と、「SQL(Structured Query Language)」などのデータの管理や操作を行う言語を操るスキルが求められます。
こうした知識やスキルを体系的に学び、その力を認定する資格として、ベンダー資格である「オラクルマスター」と特定のデータベース製品に依存しない資格である「OSS-DB技術者認定試験」があります。
オラクルマスターは、世界初の商用DBMSを販売した米・Oracle社の日本法人、日本オラクルが運営しているデータベース認定試験です。
数あるITベンダー主催の独自認定試験の中でも、特に知名度と権威が高い資格で、「ブロンズ」「シルバー」「ゴールド」「プラチナ」の4種類のグレードに分けられ、低いグレードから高いグレードへと順に挑戦していきます。
Oracle社が海外で実施している認定試験「OCP(Oracle Certification Program)」とも連携が取られており、シルバー以降の資格を取得すれば、世界共通の資格としても認定されます。
オラクルマスターの特徴は、Oracle Databaseのバージョンごとに試験が用意されていることです。
これから資格の取得を目指す人は、最新版である「12c」の資格を取ることをおすすめします。
また、オラクルマスターの認定資格には一定の効力期間が定められており、知識が最新のものであることを認定するための「Recertification(再認定)制度」が導入されています。
失効日から1年以内に更新しないと、認定証やロゴの使用が認められなくなるため、注意が必要です。
ブロンズからゴールドまでの試験はコンピュータ上で行われ、試験後にすぐに合否結果が分かります。
試験内容は主にOracle製の「Oracle Database」を使ったデータベースの管理、運用、保守、さらにSQLを使いこなすための力を問うものが中心です。
ゴールド以降の資格取得には講習の受講が必須条件になり、プラチナについては2日間にわたる実技試験を受けることになります。
一方、OSS-DB技術者認定試験は、特定非営利法人であるLPI-Japanが運営するオープンソースのリレーショナルデータベース「PotgreSQL」の活用を中心とした知識とスキルを認定する試験です。
シルバーとゴールドの2グレードがあり、シルバーではデータベース・システムの設計、開発、導入、運用ができる力を持つことを、ゴールドでは大規模データベース・システムの改善、運用、管理、コンサルティングができる力を持つことを認定します。
この資格を維持するためには、5年以内ごとに再度受験して更新する必要があります。
試験は、会場に出向いてコンピュータ上で行います。
実技や面接はありません。
知識やスキルの実践力を高める場として有用な「データサイエンティスト養成講座」
需要の高まりを受けて、データサイエンティストを養成する講座を設ける教育支援企業や業界団体が登場しています。
その代表例が、データサイエンティスト協会が主催する「データサイエンティスト養成講座」です。
この講座は駆け出しの人材のレベルアップを目的に、座学だけでは学習しにくいデータの取り扱いや目的に合った手法の選択の仕方などを具体的な課題として実践的に学んでいきます。
講座では4~5人を1グループにして、グループごとにモデルの作成・改良などの練習問題に挑戦。
グループ間で作成したモデルの精度を競い合っていきます。
データサイエンティスト養成講座は、大学の教養課程レベルの統計学を学んだ経験を持ち、何らかのデータ分析に携わっている人を対象にしています。
講座の講師は、データサイエンティスト協会に所属する企業のエース・データサイエンティストが務め、全8日の日程の中には講師を交えた懇親会も用意されています。
キャリアアップを目指す上で、知識だけでなく、さまざまな指針が得られる機会となることでしょう。
最新の機械学習技術を学べる「Verified Certificate (Machine Learning)」
近年の人工知能(AI)の中心技術となった機械学習に関する知識とスキルは、データサイエンティストにとっても必須科目になりつつあります。
機械学習の知識とスキルを一通り取得できるオンライン講座が、米・スタンフォード大学が運営する「Verified Certificate (Machine Learning)」です。
小テストによる知識の定着やプログラミング演習など実践的な力を身につけることが可能で、規定の期間内に講座を修了すれば認定証が得られます。
機械学習やその発展形であるディープラーニング(深層学習)は、従来の統計学とは別のアプローチでデータの傾向を抽出する技術です。
Verified Certificateではシリコンバレーの最新技術を反映した内容を学ぶことができるため、統計検定を取得した人も認定取得を目指すことをおすすめします。
ただし、講座内容がすべて英語で進められます。
英会話の能力さえクリアできれば、他では得られない最新の機械学習技術を学べる貴重な講座でしょう。