高信頼AI映像認識による道路管理システム
～そのAI開発技術とは～

公開日 2020年12月16日

AI,データ山岡大亮, 藤田真, 水野裕之, 太田健一, 三浦真樹

PDF版ダウンロード（1.05 MB）

本稿では，ディープラーニングを利用して高信頼なAI映像認識システムを実現する技術について紹介する。

近年，屋外のカメラ映像を事象のセンシングに活用する動きが強まっている。富士通は，AI，特にディープラーニングによる画像認識技術を，車両検知や事象検知などの形で，道路管理をはじめとする社会インフラ分野に適用し，高信頼なAI映像認識システムを実現してきた。これには，想定しうる多様な自然環境条件において，高精度で安定したAI検知を実現しなくてはならない。そのためのAI開発技術について述べる。

1．まえがき
2．ディープラーニングによるAI映像認識システム開発の課題
3．高信頼なシステムを実現するAI開発技術とは
4．適用事例
5．まとめと今後の予定

1．まえがき

近年，屋外のカメラ映像を事象のセンシングに活用する動きが強まっている。映像は様々な情報を含んでおり，一つのコンテンツから様々なデータを抽出できるという大きなメリットがある。映像のセンシングへの活用は今後大きく伸びる市場であるため，富士通の持つAI技術の強みを活かし，更に強化する技術開発を進めている。

富士通は，AI，特にディープラーニングによる画像認識技術を，道路管理をはじめとする社会インフラ分野に適用し，高信頼なAI映像認識システムを実現してきた。例えば，道路監視を行うCCTVカメラ（CCTV：Closed-Circuit Television）の映像から異常事象を自動検出し，管理者に通知することで迅速な対応を可能とするシステムなどである［1］。

高信頼なシステムとするためには，想定しうる多様な自然環境条件において，高精度で安定した映像認識を実現しなくてはならない。ディープラーニングでは，一定数の画像があれば，特別なノウハウがなくとも試行錯誤によってある程度の画像認識が実現できる。しかし，多様な自然環境下での動作が必要なこの分野では，安定して高い認識性能を実現することは容易ではない。このような状況を表す，我々の考えるAI映像認識開発の成長段階を図-1に示す。

図-1　AI映像認識開発の成長段階

本稿では，現場の厳しい要件を満たす高信頼な実用システムを実現するための，AI開発技術について述べる。

2．ディープラーニングによるAI映像認識システム開発の課題

本章では，ディープラーニングを用いて高信頼なAI映像認識システムを開発する際の課題について述べる。なお，本稿での高信頼とは，想定しうる多様な自然環境条件において，安定して高精度の映像認識を行うことを指す。

一般にディープラーニングを用いたAI開発は図-2のように行われる。

図-2　ディープラーニングを用いたAI開発フロー

まず，あらゆる画像認識技術に共通する課題が，いかに教師データを整備するかである。特に社会インフラ分野の場合，多様な自然環境条件での映像認識が必要となるため，バリエーションの網羅が最初の課題となる。

次に，AI映像認識の精度をいかに向上させるかが課題となる。一般にAI開発では映像入手，教師データ作成，学習，検証の一連の開発ステップを繰り返すが，限られた開発期間の中でその回数を最大化するためには，1サイクルの時間短縮が必須である。

更に，AI処理は計算量が大きいため，サーバー規模が増大すると，コストや設置スペースの観点からシステムが成立しないという問題がある。サーバー規模を最小化するためには，AI処理の高速化が必須である。

以降では，これらの三つの課題解決に必要な開発技術について述べる。

3．高信頼なシステムを実現するAI開発技術とは

本章では，ディープラーニングを用いて高信頼なAI映像認識システムを実現する際に必要となる，開発技術について述べる。

3.1 多様な自然環境条件の映像データセット整備

本節では，教師データとなる映像データセットの整備と，それを強化するCGの活用について述べる。

（1）大規模映像データセットの整備

富士通が道路管理分野の映像認識システムにAIの適用を開始したのは，2016年からである。しかし，AIの研究自体は過去30年以上の実績があり，世界各地の膨大なタグ付き道路映像のデータセットを保有している。更に，近年多数のお客様にAI映像認識システムを納入した実績から，膨大な量の国内の最新現場映像を追加済みであり，開発用データセットとして利用している。AI映像認識は多様な自然環境で行われるため，開発には現場映像が必須である。我々は，この開発用データセットによって多くのケースを網羅できるため，一定の品質を担保したAI映像認識システムの迅速な開発が可能である。

現場の映像を入手する場合は，想定される環境条件やパターンをあらかじめ全て洗い出し，計画的に入手しなくてはならない。我々はそのための手法を整備し，開発プロセスに規定することで，映像の網羅に漏れがないことを開発の初期段階から目標として，開発を行っている。

（2）CGの活用とAI向け品質向上技術

発生がまれな事象は，既存のデータセットにも，新たに取得した現場映像にも存在しない場合がある。我々はCG映像生成環境を整備し，想定したシナリオに基づく任意の映像を生成することでこの問題に対処している。

CGの利用には注意が必要である。認識すべき事象次第で，必要となるCGの品質が大きく異なる特性がある。一般に，必要となるCG品質は認識対象の大きさによると思われがちであるが，むしろ環境条件の複雑さに依存する点に注意が必要である。

簡単な動作検証であればCGの品質は問わないが，最終的な教師・試験データとして使用する場合には，図-3のようにほぼ現場の映像と同等の品質が必要となる。

図-3　CGによるシミュレーション映像

また，システムの目的が，車両の検知だけでなく，車名まで認識させるなどの場合，細部までリアリティのある3Dモデルやレンダリングが必要となる。例えば，図-4のCGのどちらを選択するかは目的に依存する。最適なCG品質のコントロールはノウハウとして整備し，開発に利用している。

図-4　CG品質のコントロール

更にもう一つの問題として，CGによる学習モデルでは，現場の映像を入力した場合，認識性能が向上しないことが多い点が挙げられる。この原因が的確に分析できない場合，CGの修正，学習，検証のトライアンドエラーを繰り返すことになる。我々は，それを回避して効率の良いCG活用を実現するため，CGの問題解析技術を富士通研究所と開発し利用している。これは，誤認識の原因となった部分を，ピクセルレベルで自動的に特定する技術である（図-5）［2］。

図-5　CGの問題部分の解析技術

以上のように，我々は，膨大な現場映像データセットに独自のCG解析技術を組み合わせることで，映像の十分な網羅性と品質を確保し，高信頼なAI映像認識の基礎としている。

3.2 学習モデル強化のための開発サイクル短縮

本節では，開発サイクル短縮の重要性と，そのための開発技術について述べる。

AI映像認識の精度を上げるためには，学習・検証のサイクルを繰り返す必要がある。自動学習技術も各種提案されているが，現時点では複雑な自然環境下での映像認識を実現することはできない。そのため，専門の研究者や開発者によって，人手で学習・検証サイクルを繰り返す。限られた開発期間の中でその回数を最大化するためには，学習・検証時間の短縮が必須である。

（1）10倍の高速化を実現する検証の自動化と再学習の効率化

学習モデル単体の検証，および大量の映像ストリームを使用したシステム試験を自動化するために，専用のAI映像認識システムの検証環境を整備している。

大量の画像・映像データをシナリオに従って配信し，結果のOK/NGを自動判定しレポートする。これによって，検証規模の大小に関わらず，検証・試験に要する人間の作業時間をゼロとしている。

これに加え，再学習にあたっては，独自の教師データ抽出手法を適用している。再学習用教師データの最小化，最適な学習方法の選定などを組み合わせることで，単純に繰り返す場合に比べて，一回当たりの再学習・検証時間を10分の1以下に短縮することに成功した。

（2）10倍の学習速度を実現するContent-Aware Computing技術

学習時間を更に削減するために，自動的な学習高速化技術を適用している。

富士通研究所が開発したContent-Aware Computing技術［3］は，AI処理のコードの動的分析に基づき，データの分布に応じたビット削減技術と，並列学習効果を最大化するために，並列学習処理間の待ち時間を，学習モデルの性能に影響を与えず自動的に最小化する，同期緩和技術を組み合わせている。これによって計算量を削減することで，最大10倍の学習の高速化を，自動的に行うことが可能である（図-6）。

FUJITSU JOURNALを基に改変

図-6　Content-Aware Computing技術

本技術は，順次AI映像認識システム開発に適用しており，今後道路管理分野にも適用予定である。

以上のように，我々は検証の自動化と再学習の効率化，更に学習の自動最適化を実現することで，限られた開発期間の中で十分な開発サイクルの繰り返しを行い，迅速な認識性能の向上を実現している。

3.3 大量の映像認識を実現するためのAI処理高速化

サーバーで大量の映像を同時に処理するためには，処理負荷の高いAI処理をCPUとGPUで最適に分散処理することが不可欠である。この分割設計を最適に行うためには，コード内におけるデータ転送量およびボトルネックを高精度に解析することが必須である。

我々は，富士通研究所が開発した，GPUやFPGAなど高性能アクセラレーターを用いたシステムの設計支援環境［4］を利用している。一般のツールと比較して，時系列での処理負荷・データ転送量を分析できる特長を持つ。これによって，開発の初期段階からコードの最適な分割設計を行うことができ，システム全体のAI認識処理速度を最大化できる。

この設計支援環境を利用することで，初期段階だけで40倍の高速化を実現したケースもあり，特に新規コードの最適分割設計に有効である。

以上のように，我々は，専門のAI開発者以外でも容易にAI処理の高速化を行える開発環境を整備することで，大量のAI映像認識が可能なシステムを実現している。

3.4 開発を支えるチーム

ここまで開発技術について述べたが，開発を行うチームについても触れておきたい。現在のAI技術は，ロジックベースの既存ITと異なり，本質的に不確定性が内在している。そのため，お客様を含めた社内外のステークホルダー全員が，AI映像認識でできること・できないことについて，常に同一の認識を持つことが極めて重要である。技術面だけでなくプロジェクトマネジメントが，通常のITシステム開発以上に重要であることに注意しなくてはならない。

4．適用事例

本章では，ここまでに説明した技術を適用したシステムの事例について述べる。

我々は，国土交通省様にAI検知システムをご提供している。これは，立ち往生や異常走行する車両をAI映像認識で検知し，道路管理者に伝えることで，迅速な対応を行うことを目的としたものである。システム概要を図-7に示す［5］。

図-7　AI検知システムの概要

本システムはお客様での効果検証で有効性を示した結果となり［6］，実際の業務でご活用いただいている。またこれ以外にも，多くの道路管理分野，社会インフラ分野のお客様に，各種AI映像認識システムを納入し，ご活用いただいている。

5．まとめと今後の予定

本稿では，道路管理分野における高信頼なAI映像認識システムの開発技術について紹介した。膨大な映像データセットとCG解析技術，開発サイクルを短縮する自動化・効率化技術，AI処理の高速化，この3点からなる開発プロセスを確立し，継続的により新しいAI開発技術も適用中である。

今後は，AI映像認識技術の適用領域を拡大することで，監視カメラの活用範囲を更に拡大する。一例として，道路管理分野で培ったAI技術をベースとして，昨今の水害に備えるための河川越水検知技術を開発済みである。今後は，スマートシティやMaaS（Mobility as a Service）などの分野での活用も検討していく予定である。

本稿に掲載されている会社名・製品名は，各社所有の商標もしくは登録商標を含みます。