「使えるAI」はこう作る
~ディープラーニングの実力を引き出すポイント

AI(人工知能)の実用化を強力に牽引する「ディープラーニング」。だが、実際に導入しようとすると、「学習の基となる教師データが足りない」「高速なコンピュータを手当てできず、十分な学習ができない」といった課題に直面することが少なくない。これらの課題を解決するためにはどうすればよいのか。現状を探った。

「囲碁AIがトッププロ棋士に圧勝」「SNSのつぶやきをAIが解析して株価を予測」「AIが周囲の状況を判断して自動車を自動運転」――。AIの活躍の場が急速に広がっている。その背景にあるのは「ディープラーニング」と呼ぶ人間の脳を参考にした新しい計算手法。人間の子どものように、膨大なデータを学び取り、特徴や傾向を学び取る。

ディープラーニングでは、人の脳の神経回路を模した「ニューラルネット」の層を5階層、10階層と「ディープに(深く)」重ねることで、より高度な認識が可能になる。ディープラーニングの活用領域が一気に広がった背景には、コンピュータの高速化が進み、大量データを多階層のニューラルネットで処理できるようになったことがある。富士通 AI基盤事業本部 ビジネス戦略室 室長の永井 浩史は「20年前のニューラルネットワークは3階層くらいでしたが、コンピュータの高速化によって、今では20階層から200階層まで作れるようになりました」と説明する。

精度の高いディープラーニングを実用化する上で、コンピュータの高速化と同時に欠かせないのが、十分な量の“教師データ”を用意することである。教師データとはコンピュータが学習するためのデータであり、その出来がディープラーニングの精度を決める。優秀な教師は優秀な生徒を育てる。問題は「優秀な教師をどうやって揃えるか」である。例えば「工業製品の外観不良を検知するシステムを作ろうとしても、そもそも不良品の画像データ自体はあまりない。これでは十分な量の教師データを用意できず、検知の精度が向上しない。

今、この教師データをいかに十分に用意できるのかがAIを活用するための大きなネックになっている。富士通の調査では「AIの適用方法がわからない」と並んで「教師データ作成が難しい」という答えが、AI活用におけるユーザの悩みのトップを占める。

教師データを人工的に作り出す

どうすれば十分な数の教師データを用意することができるのか――。こうした顧客の悩みに応えて富士通が取り組んでいるのが、データを加工して教師データを人工的に作りだすことだ。同社が2017年4月にサービス提供を開始したディープラーニング活用ソリューション「FUJITSU Cloud Service K5(※)Zinraiプラットフォームサービス Zinraiディープラーニング」の1メニューとして用意する。

富士通が福岡県農林業総合試験場と共同で実施したイノシシの捕獲システムの実験例では、もともと教師データとして使える画像は数十枚しかなかった。このシステムは暗視カメラが撮影した鳥獣の不鮮明な画像でイノシシの成獣だけを判別し、箱罠の扉を閉じる指令を出すというもの。教師データが数十枚しかないのでは、イノシシとタヌキを識別することは難しい。

そこで富士通は写っている鳥獣の画像をデータ拡張技術を使って、画像を数百枚程度にまで増やした。これにより十分な数の教師データを確保して、3日間のディープラーニングによりイノシシの成獣をほぼ100%識別できるようにした。「どうやって教師データを増殖させるかは、まさに長年培ったノウハウ。人間が特徴点を決めて画像を認識させる従来の画像処理では、モデルの構築に半年以上かかっただろう」と富士通の永井は説明する。

他にも自動運転や安全運転支援(ADAS)などで求められる車両認識シーンでは、3次元コンピュータグラフィック(3DCG)を駆使して車種や色、見る角度などを変えて様々なバリエーションの画像を作りだすことで教師データの数を増やしている。「車種を認識する場合でも、リアルな写真からの学習には限界があります。そこでCGを使って色や角度や当たる光の強さなどの違う画像を教師データとして作成して、認識精度を上げます」と永井は説明する。

精度を上げるために、3DCGとリアル写真が混ざった教師データを作成する際にも工夫をしている。フロントガラス越しに写る車内の人物やナンバープレートはマスキングするなど、CGとリアル写真の特徴量を合わせている。「余計なデータを学習すると、かえって認識精度が落ちる」(永井)からだ。これも同社独自のノウハウから生まれた工夫だ。

※ 「FUJITSU Cloud Service K5」は「FUJITSU Cloud Service for OSS」にブランド変更しました。

続きは、こちらからお読みいただけます

「使えるAI」はこう作る ~ディープラーニングの実力を引き出すポイント

概要

  • 教師データを人工的に作り出す
  • スパコン技術で最新GPUの性能を引き出す
  • ディープラーニングの先を行く技術も開発
  • 量子コンピューティングで次のステージを切り開く

ページの先頭へ