English
研究者の夢

世界を舞台にする研究者が語る、機械学習の魅力と挑戦

English

2024年1月23日 掲載

ある機械学習の記事に、目を奪われた

2016年の年末、大学院生だった私は、
SNS上で深層学習を用いてイラストを生成するという記事を見つけました。
現在の生成AIと比べると品質はかなり低かったのですが、
それでも生成された画像が人の顔と分かるくらいの精度があり、
さらにそれがランダムなノイズから生成されているという内容に驚きました。
この記事を通して、敵対的生成ネットワーク(GAN)という高精度の画像生成や変換ができる技術を基盤としていることが分かり、その技術を調べることで、機械学習に出会いました。
その時から、電子工学専攻にもかかわらず、機械学習の理論とそれを構成する数学の勉強、
論文の精読、プログラミング、GPU環境の構築を経て、記事に記載された生成AIを自分で再現しました。
それでもまだ熱意は消えることなく、CycleGAN(*1)など面白いと思える論文が出るたびに、
それらを再現実装していくという日々を送っていました。
そのような日々の中で就活が始まり、機械学習を用いた開発に携わりたいと考えるようになりました。

目指すは、化石の鑑定全自動化

富士通に入社後、AIサービスの事業部に配属され、INPEX様、JOGMEC様、秋田大学様と共同で行ったナンノ化石自動検出による地層年代測定のプロジェクト(*2)に参加しました。
このプロジェクトでは二つの重要なことを学びました。
一つ目は、対象への深い理解と知識習得が必要だということです。
二つ目は、深い知識の獲得にはお客様との密なコミュニケーションが必要だということです。

検出対象であるナンノ化石は専門家が必要なほど鑑定が難しく、
見分けるポイントの理解なしには高精度のAIモデルを開発することはできません。
専門家と定期的に会話する機会を設けて直接質問したり、
時には現地で顕微鏡を使ってナンノ化石を観察したりして、ナンノ化石への理解を深めていきました。
はじめの頃のAIモデルは精度が低く、データの入力方法の工夫や、
パラメータ調整の試行錯誤を繰り返しました。
最終的には自分たちでおおよその鑑定ができるレベルになり、高精度のAIモデルを作ることができました。

その後関わった別のプロジェクトでは、
深層学習を用いたソリューションをお客様に提案し、高評価をいただきました。
これらの経験を通して、深層学習モデルの開発だけでなく、ソフトウェア開発手法、
機械学習プロジェクトの進め方、
お客様との効果的なコミュニケーションやビジネスの進め方などを学びました。
ビジネス現場に近いシステムエンジニア職と技術の専門性を究める研究職、自分の今後のキャリアを考えると、
どちらの道へ進んだら良いか迷いましたが、機械学習の研究を深めたいという原点に戻り、
社内ポスティング制度を利用して研究所へ異動しました。

論文採択、研究者として第一歩を踏み出す

研究所に異動してから、主に二つの大学と共同研究を行いました。
一つ目の大学とはシーングラフについて共同研究を行いました。
シーングラフとは、画像中の物体の関係性を表現するデータ構造です。
物体をノード、物体同士の関係性をエッジとしたグラフで、特徴的なのは関係性を予測するという部分です。
物体同士の関係性を表現としてどのように獲得するのかが課題となり、その獲得方法を提案しました。
この研究結果を初めて主著として論文(*3)にまとめ、WACV2023(*4)という国際会議に採択された時は喜びもひとしおで、ようやく研究者としての第一歩を踏み出せたと感じました。

二つ目のトロント大学との共同研究では、複雑なデータから必要な情報を抽出し、
目的に応じたAIを実現する技術の開発に取り組みました。
この研究ではトロント大学のJimmy Ba先生と定期的に打合せを行いました。
Jimmy Ba先生は最適化手法の一つであるAdam(*5)の著者であり、
彼の数々の業績に裏打ちされた確かなアドバイスと、先の先を見据えた発想が毎回楽しみでした。
我々の共同研究の成果である「生成モデルの学習安定化技術について」はAI・機械学習分野のトップカンファレンスICLR2023に採択(*6)され、富士通やトロント大学のプレゼンス向上に少しは貢献できたのではないかと思います。

作曲の経験を活かして

子供の頃からピアノを習い、クラシックやゲーム音楽をたくさん演奏してきました。
音楽は自分の中に根付き、日々の練習が日常の一部でした。
大学時代には作曲に興味を持ち、専用ソフトを使って曲を作り、ボーカルを入れることもありました。
作曲する時には、まずはさまざまなジャンルの音楽を聴いて分析を行い、
他人の曲を参考にしながら、自分の色を加えて曲を作りました。
何かの専門を究める姿勢は、このような経験から培われたのだと思います。
研究開発においても、最初は大量の関連する論文を読み込み、研究テーマを決定します。
そして、論文の内容の再現実装を経て実験基盤を固め、自分のアイデアを実装するというプロセスで進めています。

AutoMLと、その先の研究に向けて

今、私はFujitsu Research of America(FRA)でAutoML(*7)の研究開発に取り組んでいます。
研究目標の1つは、テキスト、画像、音声などさまざまな種類のデータから、
あらゆるタスクに応用可能な意味のある特徴やパターンを抽出する究極の基盤モデルの作成です。
海外の研究所への異動に伴い、仕事や生活環境が大きく変わりました。
慣れない環境に適応しながらではあるものの、AutoMLに囚われない新しい研究テーマを見つけ、
結果を出すことも目標にしています。
なぜなら自分の知る優れた研究者は、与えられたテーマだけでなく、
自ら優れた研究テーマを導き出せる人たちです。
そういった人たちに少しでも近づけるよう、多様な人材と切磋琢磨するため渡米することに手を挙げ、
日々研究を進めています。

FRAメンバーがAutoMLに関する議論をしている
FRAメンバーがAutoMLに関する議論をしている

私は、機械学習の他分野への応用に学際的観点から興味があり、大学院時代には、
機械学習を活用してデバイス構造探索が出来ないかと、検討した時期がありました。
当時は、まだ機械学習について浅い知識しか持っておらず、今思うと見当違いな実験をしていましたが、
今ならまた違うアプローチがとれると考えています。
また、タンパク質の構造を高精度で予測するAlphaFoldは衝撃的でした。
その論文は実用可能性も十分に検証されており、現在多くの場面で使われている事実に感嘆します。
今はまださまざまな分野を勉強している段階ですが、将来的には多様な視点を持ち、
世界中の人々が幸せに暮らす世界に少しでも貢献できるような研究成果を出したいと考えています。

長谷川 創
Hasegawa So
人工知能研究所
大学院 電子工学科卒
2018年入社
私のパーパス
「人間万事塞翁が馬」
休日は家族でハイキングに出かけて、自然の中で過ごすことが多いです。それ以外は読書で過ごしています。美術、生物学、歴史の本を主に読んでいます。最近は、フルーツティーにハマっており、夜作業する時のお供になっています。

編集後記

編集担当:コミュニケーション戦略統括部 白 湘一

近年、AI技術が急速に発展し、昨日まで主流だった技術が明日には支流であることも珍しくない。例えば、彼が機械学習に取り組み始めた当時は画像生成と言えばGANだったが、それが今ではdiffusion modelなどに置き換わっている。「だからと言って私はGANがもう日の目を見なくなったとは思いません。画像生成における生成品質は、生成モデルのいくつかある評価指標の一つでしかありません。自分が解きたいタスクに合致する技術を流行に追われず、見定めていきたい」と彼が語る。また、インタビューの最後に、彼は「聡明で行動力のある配偶者に感謝です。時にはリスクを取りながら、選択肢を増やし、未来の可能性を拡げる彼女と同様に、私も自分の人生を制限せずにさまざまなことに挑戦していきたい」と微笑む。素敵な話を聞かせていただいた。

このページをシェア

  • facebook
  • twitter
  • LinkedIn
  • LINE
  • Weibo

Recommend

 
 

Connect with Fujitsu Research

LinkedIn
Twitter
YouTube
ページの先頭へ