近年の“第3次AIブーム”は、機械学習技術の一つであるディープラーニングの登場とコンピューティング性能の向上がもたらしたと言われています。中でも画像認識技術の発展は目覚ましく、すでに様々な領域で実用化されています。最近は画像だけでなく映像から特徴を抽出・識別することも可能になり、活用の幅がさらに広がりつつあります。
しかし、画像認識技術のビジネスへの応用は簡単なことではありません。AIによる認識精度を高めるには「正解」となる大量のデータを用意してAIに学習させなければならず、そのために膨大な時間と手間がかかるという課題があるからです。特に映像データの場合、そもそも正解のデータを大量に収集すること自体が困難な場合もあります。
富士通研究所が開発した「行動分析技術 Actlyzer」は、そんな課題の解決を目指したところから研究開発がスタートしました。
「映像から人の動きを高精度に認識するAIモデルを作成するには、正解の学習データを大量に収集してその評価をするだけで、全工程の95%近い時間とコストがかかると言われています。さらに、作成されたモデルは汎用性に乏しく、横展開することが難しいため、異なる環境や用途に適用するためには、さらに時間とコストをかけてその環境・用途に合わせた学習データをあらためて大量に収集して、新たなモデルを作成しなければなりませんでした」とデジタル革新コア・ユニットの岩崎翔は説明します。
こうした課題を解決するために富士通研究所が取り組んだのが、大量の学習データを準備しなくても人の行動の認識・分析を実現する技術の開発です。2018年から研究開発に取り組み、その成果として2019年に完成したのがActlyzerです。
Actlyzerはどのようにして行動認識の実現を容易にしているのでしょうか。
実は、「歩いている」「走っている」「止まっている」といった単純な動作のAI認識モデル作成のための学習データとなる映像を収集することはそう難しいことではありません。それらの動作は様々な映像データの中に含まれるため、映像のどの部分に認識させたい動作が映っているかという情報を付与して学習すればよいからです。ただし、例えば「周囲を見渡しながら行ったり来たりしている」といった複数の動作が組み合わさった複雑な行動を認識しようとすると、学習データとして適切な映像を収集することは困難です。
これを解決するために、Actlyzerではまず、複雑な行動の構成要素となる約100種類に及ぶ人の基本動作を独自に定義して、このすべての基本動作について高精度に認識できる学習済みAIモデルを作成しました。
次に、この基本動作を組み合わせ、順番、発生場所、行動の対象などの情報をかけ合わせることで複雑な行動を認識するというのがActlyzerのアプローチです。この技術の研究開発には、様々なバックグラウンドを持つ研究者がプロジェクトに集められました。
「Actlyzerの基本動作は、中国の研究開発拠点(富士通研究開発中心有限公司:FRDC)とも協力し、頭や腕などの人の部位の様々な角度や動きのパターンに対して、数十~百万もの動画像・静止画像を収集し、さらには、モーションキャプチャで収集したデータも活用して、AIモデルを学習しました」(岩崎)
人の基本動作の組み合わせや順番から複雑な行動を認識するルールの開発に取り組んだのは、時系列データ分析や知識処理などの研究経験のある杉村由花でした。
富士通研究所がActlyzerを正式に発表したのは、2019年11月のことです。研究開発がスタートして発表に至るまでの間、様々なビジネス領域にActlyzerを適用した実証実験が行われました。実際の現場での実証実験は、ソリューション開発経験の豊富な研究者が富士通の事業部門とともに担当しました。
主に製造業の生産現場におけるソリューション開発に取り組んだのが、石川千里です。
また例えば、ひざを伸ばしたまま重いものを持ち上げるなど、作業者の危険な姿勢や行動を検知することで事故を未然に防止することも可能になります。「こうした基本動作の組み合わせのルールはカスタマイズできるので、AIがなぜそのように認識したのか分からないといった『AIのブラックボックス化』を避けられるのも、Actlyzerの大きな特長です」と石川は説明します。
一方、防犯分野におけるソリューション開発に取り組んでいるのが、近野恵です。
現在、街中には数多くの監視カメラが設置されていますが、必ずしも防犯に有効活用されているわけではありません。映像から不審行動をリアルタイムに発見して犯罪を未然に防止するには、まずは不審行動を認識するAIモデルが必要です。しかし、そのAIモデル作成のために必要な、不審行動の学習用映像データを大量に収集することは事実上不可能だったからです。
Actlyzerはこのほかにも、小売店舗での来客の購買行動の分析や、店員の応対動作の確認などの用途においても、実用化が期待されています。
Actlyzerはすでに、最新のAIソリューションとして提供する準備が整っています。現在は、富士通のAI技術を体系化した「FUJITSU Human Centric AI Zinrai(ジンライ)」のZinrai活用支援サービスとしての実用化や、AI画像解析ソリューション「Fujitsu Technical Computing Solution GREENAGES Citywide Surveillance(グリーンエイジズ シティワイド サーベイランス)」との連携も検討が進んでおり、そのためのさらなる改良に取り組んでいます。
「Actlyzerは、事前の機械学習にかかる時間と手間を省力化することで、AIの導入にかかるコストとリードタイムを大幅に軽減することができます。さらに、監視カメラ映像を活用するために、多数の映像処理を効率化するなど、導入のしやすさ、ビジネス展開のしやすさも考慮しています。さらに、適用現場によっては、カメラの制約などで鮮明な画像が得られないこともありますので、認識精度を向上させるための映像鮮明化技術など、周辺分野の研究開発も進めています」(近野)
また、ユーザビリティのさらなるブラッシュアップを図っていくとしています。
「直感的なクリック操作で、ルール作成やパラメータ変更できるようにするなど、ユーザーインターフェースや操作性の改良にも取り組まなければなりません。もちろん、多種多様なビジネス領域に向けた業界ごとのルールの拡充や、複数の人が絡む行動の判定など、ほかにも様々な課題に取り組んでいきます」(杉村)
誰もが手軽に使えるAIの実現を目指し、Actlyzerの実用化に向けたプロジェクトの挑戦はまだまだ続きます。