国内で唯一!
富士通の行動認識技術がAI分野のトップレベル会議CVPR2021のAVA Challengeで2年連続上位入賞
2021年8月4日
English映像から人の行動を認識する行動認識技術は、小売店での接客対象者の検知や、公共機関では不審者の発見など、様々な活用が期待されています。
世界中で行動認識の研究活動が活発に行われていますが、富士通では大量な映像を学習する必要がなく、複数の動作を組み合わせた複雑な行動を認識できる 「 行動分析技術 Actlyzer」を研究開発しています。
今回、2021年6月に開催されたAI分野のトップカンファレンスのひとつである CVPR2021の行動認識コンペティション、AVA Challenge 2021(AVA-Kineticsタスク)において、世界第2位を獲得しました。
AVA Challengeは、2018年の第1回以来 AI分野の世界トップレベルの企業や大学が参加する、最も注目される行動認識コンペティションです。今回、参加した全11チーム中2位を獲得し、昨年の3位に引き続き2年連続で上位入賞しました。
開発チーム:(左上)Tan, Zhiming (右上)Zhu, Xiantan
(左下)大日方 裕也 (右下)山本 琢麿
行動認識コンペティションについて
AVA-Kineticsは、Google AIとDeepMindが公開した23万を超える映像データを含む大規模データセットを用いて、映像中のさまざまな行動を認識するタスクです。このタスクでは、”歩く”、”立つ”、の他に、”人と話す”、”モノに触る”といった行動を認識するため、人やモノとの関係性を捉える必要があります。
こうした関係性を捉える従来手法として、AlphActionがあります。AlphActionは映像から抽出した人や物体の領域を、関係性の特徴量として認識に用いる行動認識AIです。しかし、AlphActionは映像中の背景情報(人や物体を含まない領域)との関係性を把握することができません。例えば、水の中にいる人の行動を”立つ”と誤って認識するなど、性能が限定されます。
そこで我々が提案した手法では、映像全体をコンテキスト情報として特徴量化し、AlphActionの特徴抽出器に組み込みました。これにより、人と背景情報との関係性を考慮した行動認識が可能になります。また、人や物体検出の最適なAIモデル構造を徹底的に探索しました。こうした試行錯誤はコンペティションにおいては精度を向上させる最も堅実な方法です。
その結果として、参加した11チーム中、2位を獲得し、3位を獲得した昨年に引き続き、上位入賞を果たすことが出来ました。
図 1 富士通が提案した行動認識手法の概要
開発チームからのコメント
・富士通研究開発中心有限公司(FRDC) Tan, Zhiming プロジェクトマネージャー
我々の培ってきた行動分析技術を他の研究機関と比較するため、CVPRのWorkshopで行われたAVA Challenge 2021に参加しました。
AVA Challengeでは、映像中の様々な人の行動を認識するのが課題でした。今回のAVA Challengeで得られた技術や経験を今後の研究開発に活かしていきたいです。
・富士通研究開発中心有限公司(FRDC) Zhu, Xiantan 研究員
開発したAIモデルでは、映像から抽出したコンテキスト特徴を、人物特徴や物体特徴などと合わせることを試みました。
「飲み物を飲む」など、人の周りにあるモノ(この場合はコップなど)との関係が重要となる行動の認識には、元の映像から切り出された人領域を基に、関係するモノが含まれるよう一定範囲を広げた領域を参照して行動を認識する手法を検討しました。
さらに、複数のAIモデルの多数決を取る(モデルアンサンブル手法)ことで、AVA Challenge 2021のAVA-Kineticsタスクで2位を獲得しました。
・富士通研究所 先端融合研究所 大日方 裕也 研究員
前回3位からのランクアップを目標とし、コンペに参加しました。最新の論文から行動認識技術のトレンドやテクニックを調査し、メンバー間で共有・議論することで、新たなアイディアが創出されるように努めました。
結果として、前回以上にメンバー全体の技術力・知識量が深まったことにより、目標を達成できたのではないかと思っています。次回もさらなる挑戦心をもって、より高い目標にチーム全員で取り組んで行きます。
・富士通研究所 先端融合研究所 山本 琢麿 研究員
前回に引き続き日本と中国の合同チームでコンペに挑みました。前回はそれぞれのオフィスでface-to-faceのミーティングもできたのですが、今回は感染症予防のため直接会って会話することはできませんでした。
このような逆境の中でも、オンラインを通して前回より緊密なディスカッションをし、それぞれのアイディアを積み重ねていったことが今回の成果につながったと思っています。次はさらなる高み、1位を目指してチーム一丸となって頑張りたいです!
関連情報
・ 富士通の行動分析技術 Actlyzerが導入されたGREENAGES Citywide Surveillanceのご紹介
・ 映像から人の様々な行動を認識するAI技術「行動分析技術 Actlyzer」を開発(2019年11月25日プレスリリース)
本件に関するお問合せ
fj-actlylzer-contact@dl.jp.fujitsu.com
EEA (European Economic Area) 加盟国所在の方は以下からお問い合わせください。
Ask Fujitsu
Tel: +44-12-3579-7711
http://www.fujitsu.com/uk/contact/index.html
Fujitsu, London Office
Address :22 Baker Street
London United Kingdom
W1U 3BW