AIの活用で応用が急拡大する画像認識
昨今、スマホやパソコンのロック解除で顔認証が使われています。
顔認証の基礎技術である画像認識技術とは、カメラで撮影した画像データに映る人やモノの特徴を見つけ出し、対象物が誰なのか何なのか識別する技術のことです。
近年、認識手法に人工知能(AI)が活用されるようになり、その応用が急激に広がりました。
現在では人間の眼よりも正確で安定した判断を下せるまでに進歩しています。
Contents [hide]
目視になくて画像認識技術にあるメリットは?
暮らしや仕事の中には、人の眼で見て状況判断や的確な作業を行う場面が多くあります。
スーパーで野菜を買う時には眼で鮮度を確かめて購入する品を選び、クルマを運転する際には走行環境を目視判断して的確に操縦をし、医師は患者の様子を見ながら診察します。
いまや、これらの作業が、画像認識技術で次々と機械化・自動化しつつあります。
画像認識技術を活用してこれまで人の眼に頼っていた作業を機械化・自動化することで、どのようなメリットが生まれるのでしょうか。
まず、考えられるメリットとして、認識対象の状態や状況を客観的かつ安定的に判断できるようになる点が挙げられます。
人間の目視による認知能力は、個人の主観の影響が及びがちで、精度も判断基準も人それぞれ。
しかも、その人のコンディション次第で、結果のブレも生じます。
例えば、工場では出来上がった製品の品質を目視で検査しますが、朝と比べて夕方は集中力が低下して見落としが増えると言われています。
画像認識システムを活用すれば、客観的かつ画一的に仕事をこなせるようになるわけです。
また、人が目視で、正確に状態や状況を判断できるようになるには、相応の経験を積む必要があります。
少子高齢化が加速する現在、経験豊富な働き手を確保したり、イチから育てたりするのは難しい時代です。
画像認識技術を使えば、人の眼に頼っていた仕事の無人化や、スキルレス化が可能でしょう。
さらに、人の眼ではチェックしきれない膨大な対象物にキメ細かく目配りできる点も画像認識技術を活用するメリットの1つです。
例えば、空港など大勢の人が集まる場所で不審者を発見する作業は、監視カメラを多数設置して警備員が目を凝らしても難しいことでした。
ここに画像認識を活用すれば、見落としを大幅に減らすことができるでしょう。
こうしたメリットを生かすことで、画像認識を活用して走行環境を判断する自動運転車ならば、人が運転するクルマよりも交通事故を減らすことができるとされています。
ディープラーニングの導入で画像認識の精度が向上
多くのメリットを持つ画像認識技術を最大限活用するためには、いくつかの条件があります。
まず、画像認識の精度が人の精度と同等かもしくは超えていることが大前提です。
いくら365日24時間疲れ知らずで判断できたとしても、誤認識を頻発するようでは使いものになりません。
1990年代には、デジタルカメラで、被写体となる人を認識してピントを合わせる画像認識機能が実用化しましたが、画像認識システムの認識率は、人に比べて大きく劣っていたため、その応用が広がることはありませんでした。
ところが、2012年、画像認識の技術開発に画期的なブレイクスルーが登場します。
画像認識技術の研究者が画像認識の精度を競う「ILSVRC(ImageNet Large Scale Visual Recognition Challenge)」と呼ばれるコンテストにて、カナダ・トロント大学のジェフリー・ヒントン教授率いるグループが、圧倒的な高精度で優勝し、世界に衝撃を与えました。
それまでの優勝者の誤認識率は約25%でしたが、一気に16.2%まで引き下げたのです。
トロント大学の成果は、画像認識の分野にAIの一種であるディープラーニング(深層学習)を初めて適用したことで実現したものです。
この2012年のコンテスト以降、画像認識へのディープラーニングの適用がムーブメントとなり、精度は飛躍的に向上。
2015年にはマイクロソフトのグループが人間の誤認識率の目安である5.1%を初めて下回る4.9%を達成しました。
つまり、現在の画像認識システムの精度は、人間をはるかに上回るレベルに達していると言えます。
ここに至って、さまざまな分野に画像認識システムを適用できるようになりました。
ディープラーニングで画像認識の高精度化を達成した理由
画像認識技術の開発には、長い歴史があります。
しかし、ディープラーニングを適用するまで、人間の認識率を超えることができませんでした。
いったいどうやって長年の厚い壁を突破できたのでしょうか。
過去の画像認識では、テンプレートマッチングと呼ばれる手法を使い、画像の中に映る人やモノの位置を検出していました。
これは、検出したい人やモノを見分ける手本(テンプレート)を用意し、エンジニアが定めた処理手順、ルール、判断基準をマニュアル化。
そのマニュアル通りにコンピュータが認識処理を実行する手法です。
例えば、犬と猫を見分ける場合、耳が垂れ下がっていて鼻が突き出ているのは“犬”、耳が尖がっていて目が丸いのが“猫”というように、判断時の視点や基準を定義しておきます。
しかし、この方法には多くの欠点があります。
まず、マニュアルに示した基準に沿わない例外が数多くあることです。
当然、耳の尖った“犬”もいるし、耳が丸まった“猫”だっています。
より正確な判断基準を設けるためには、複雑な場合分けや条件設定が必要ですが、複雑になればなるほど、人間が完璧に記述することは極めて困難です。
また、見本となる画像データと認識対象の間で、画像の撮影条件が大きく異なっている場合に認識率が低下することも欠点でした。
画像に映っている“犬”の顔が斜めから映っていたり、暗がりで映っていたりすると、途端に認識できなくなってしまいます。
また、認識したい人やモノそれぞれの数だけ、見本を用意する必要もあります。
こうした従来手法の欠点を解消したのがディープラーニングです。
その最大の成功要因は、認識の手順や基準を人間が作るのではなく、機械に自発的に作らせた点にあります。
ディープラーニングは「機械学習」と呼ばれる技術で、機械が自発的に認識手法を獲得します。
具体的には、ニューラルネットワークと呼ぶ、脳の神経回路網を模した電子回路を用意。
そして、認識対象となりそうなデータを大量に学習しながら、より精度の高い答えが得られるように、ニューラルネットワーク内部の演算パラメータを調整します。
その際、人間は学習用データを用意し、与えて、その正解を教える、学習支援に徹します。
人間が作った認識マニュアルに頼らず、高性能なコンピュータのパワーで自ら悟るからこそ、マニュアルを超える認識率を実現できるのです。
おすすめ記事:【i:Engineer】変顔 vs 顔認証技術 変顔でセキュリティは強化されるのか!?
顔認証技術に変顔を登録することで、セキュリティは強化されるのか!? コメディアンのもりすけさんが変顔を駆使して仮説を検証してみました。
画像認識技術の応用活用
画像認識の認識率が高まったことで、これまで人間の眼に頼っていた作業が次々と機械化・自動化されています。
身近な応用から専門的な応用まで、その範囲は驚くほど広がっています。
数ある活用事例の中から、面白い事例を3つ紹介していきましょう。
中国のネット通販最大手であるアリババでは、画像検索で欲しい商品を見つける機能をオンライン通販サイトに組み込んでいます。
街で見かけたモノが欲しいと思ったらスマホで写真を撮っておき、それを同社のサイトにアップロードして画像検索すれば、探している商品または類似の商品を見つけ出すことができます。
飲食店や小売店が高品質な商品を仕入れるために、画像認識を活用する例も増えてきています。
例えば、ベンチャー企業のマクタアメニティは、スマホで撮影したトマトなど野菜の写真から被写体の色を分析して、食材のおいしさを判定するシステムを開発しました。
九州地区を中心に展開するホームセンターであるグッディでは、元気な花の苗の仕入れを支援する画像認識システムを活用しています。
カメラで撮影した苗の画像を認識し、花の開き方や葉の大きさを分析。
苗の状態を4段階で自動評価しています。
さらに、焼津市水産工場では、画像から天然マグロの品質を判定するシステムを導入しました。
キハダマグロの尾の断面から、ベテランの仕入れ人に匹敵する選択眼で全体の品質を判定できます。
これらは、いずれも熟練した人間が担っていた目利き作業を機械化した例であり、仕入れ作業のスキルレス化を後押ししています。
ベテラン医師でも見逃してしまうような病気の兆しを、X線写真の画像から見つける取り組みが広がっていますが、さらに高度な活用法も考案されています。
立命館大学は、低画質なCT画像でも、高画質の画像と同様の高精度診断が可能な画像認識技術を開発しました。
高画質CT画像の撮影では、被験者にX線を繰り返し当てることになるため、放射線の被曝量が多くなりがちです。
ところが低線量で撮影すると明らかな画像劣化が生じる課題を抱えていました。
同大学では、一度だけ撮影した高画質画像を参照しながら、低画質画像でも高精度の診断が可能になる認識技術を開発し、通常の 1/20 の超低線量で高画質画像と遜色ない診断ができるようにしました。
画像認識技術は今後も高い情報価値を生み出す
画像認識技術は、より付加価値の高い情報を抜き出す方向へと進化しています。
単に写っている人が誰であるのかを判別するだけではなく、その人が喜んでいるのか、怒っているのか、感情を判定できる技術が登場してきています。
また、モノの認識でも、先に紹介した食材や花の苗の仕入れの応用例のように、画像からモノの状態を判断する情報を得るための技術開発が活発化していきそうです。
より正確な認識を行うため、画像認識だけではなく、音や感触などのデータを勘案して、多角的に認識できる技術の開発も進められています。
画像認識技術の本格的な応用は始まったばかりです。
便利な暮らしや、効率的な仕事、円滑な社会活動を営む上で、画像認識は近未来には欠かせない技術になりそうです。