-
注1:声の大小や声色などの話し手から聞き手に伝わる周辺言語情報のこと

産学連携・人材育成・知財創出・ベンチャー育成を統合的に推進している「早稲田オープン・イノベーション・バレー構想」を打ち出す早稲田大学。富士通は同大学とともに「Fujitsu Co-Creation Research Laboratory at Waseda University」を設立し、組合せ最適化問題を高速に処理する量子インスパイアード技術「デジタルアニーラ」の活用に向けた共同研究を産学連携で進めています。そうした中で、同技術を活用して「自然言語処理AI」の開発を進めているのが、早稲田大学 グリーン・コンピューティング・システム研究機構 知覚情報システム研究所の会話AIメディア研究グループです。同グループから大学発スタートアップ企業を立ち上げて会話AIサービスの実用化を目指す取り組みについて、早稲田大学の松山洋一先生、高津弘明先生、富士通の瀧田裕主任研究員、松本奈紗研究員が意見を交わしました。
2022年10月11日 掲載

-
松山 洋一 氏
Matsuyama, Yoichi
早稲田大学 グリーン・コンピューティング・システム研究機構
知覚情報システム研究所 客員主任研究員(研究院客員准教授)
株式会社エキュメノポリス 代表取締役 -
高津 弘明 氏
Takatsu, Hiroaki
早稲田大学 グリーン・コンピューティング・システム研究機構
知覚情報システム研究所 次席研究員(研究院講師)
株式会社エキュメノポリス リサーチ・サイエンティスト

-
瀧田 裕
Takita, Yutaka
富士通株式会社
研究本部 量子研究所
最適化テクノロジーPJ 主任研究員 -
松本 奈紗
Matsumoto, Nasa
富士通株式会社
研究本部 量子研究所
最適化テクノロジーPJ 研究員
「自然な会話ができるAI」の実現に挑む
まずは先生お二人の研究テーマについて紹介してください。
専門分野は自然言語処理であり、博士論文の研究テーマは「快適な情報享受を可能とする音声対話システム」です。本研究は、受動的に情報を消費できるラジオのようなプッシュ型と、ユーザーの能動的な情報行動に基づいて欲しい情報を取得できるAIスピーカーのようなプル型のモードを高頻度に切り替えながら情報にアクセスできる会話システム(注2)の開発を目指したものです。その要素技術として、テキストからパーソナライズした発話計画を生成する要約システムをはじめ、意図理解システムやメリハリのある音声合成システムなどの研究を進めてきました。現在はこれらの技術を応用した「英会話能力判定エージェントシステム」の研究に注力しています。
-
注2:膨大な情報から必要な情報を取得する課題に対し、各人ごとにパーソナライズした情報をユーザーの非明示的な意図を汲み取りながらメリハリを付けてテンポよく伝える、話し上手な会話システムを開発し、解決を目指す

どのような経緯から富士通との共同研究に応募したのでしょうか。
「快適な情報享受を可能とする音声対話システム」では、例として、ニュース記事のような日々更新される膨大な情報の中から、自分の求める内容のみを効率的に取得したいというニーズを想定して研究を進めてきました。ここでは、対話システムの発話計画を生成する問題を、話題の異なる複数の記事から、各記事の談話構造(注3)を制約としてユーザーが興味のありそうな文を抽出し、その内容を音声で制約時間内に伝える組合せ最適化問題として定式化しました。
この手法を使って前晩のニュース記事を解析して翌朝の通勤・通学前までにユーザーごとにパーソナライズした発話計画を用意したいわけですが、文の数が増えると1つの問題を解くのに膨大な時間がかかり、ユーザー数が増えると解くべき問題が増えて処理時間が増加するという課題に直面しました。例えば8万人分の発話計画を翌朝までに用意するには、すべての処理を6時間以内に終える必要がありますが、一般的な1コアのプロセッサで処理した場合、最適解を得るのに1人あたり平均900秒、8万人では約2万時間(約833日)かかる計算となりとても実現できません。
そうした中、デジタルアニーラを活用した共同研究を知り、組合せ最適化問題に特化したデジタルアニーラならば高速処理が可能になると考え、共同研究に応募しました。
-
注3:文中の文・句の役割関係、話題の推移といった構造のこと


ユーザーへのパーソナライズを最適化問題に落とし込む
デジタルアニーラを使ってどのような実験・評価を行いましたか。
文に対して談話構造と複数のユーザーの興味度が付与されたニュース記事データを用いて、提案手法で生成した発話計画が、どれだけ興味のある情報を提示でき、どれだけ興味のない情報を除外できたかを評価しました。特に処理時間については、デジタルアニーラを使うことで4,096ビット以下の問題(15文~25文の記事6個程度)の解が約0.2秒で得られ、8万人分の発話計画が4時間半程度で生成でき、実用化に向けた手応えを得ることができました。
また、この技術をバーチャルミュージアムガイドに応用し、国宝や重要文化財の解説文からパーソナライズした発話計画を生成し、そのシナリオに基づいて展示物を解説することの効果を検証しました。その結果、パーソナライズされたシナリオに基づくガイドは、パーソナライズなしのガイドに比べて、興味のある作品を選んで分かりやすい説明できただけでなく、楽しさや再訪意欲などの項目でも改善が見られました。
この間、富士通とはどのように共同研究を進めましたか。
コロナ禍の影響もあり、富士通との月1回の定例会はオンラインのビデオ会議で行いました。定例会では主に、デジタルアニーラを使った実験の結果を報告し、その結果と今後の方針について議論しました。富士通には特に、デジタルアニーラのパラメータ設定などをアドバイスしてもらいました。
早稲田大学との共同研究で分かったのは、組合せ最適化問題を高速に処理するデジタルアニーラは、モデルによって結果に差が出るということです。今回の場合、先ほどの高津先生のお話にもありましたが、談話構造と時間を制約とした中でユーザーの興味度が最大となる文章を抽出するという線形計画問題(最適化問題)に落とし込んだモデルは、デジタルアニーラにぴったり当てはまるものでした。詳細なパラメータ設定についての質問には「こうすればもっと早くなりますよ」といったコツやヒントをその都度お答えしました。デジタルアニーラの使いやすさもあり、基本的には高津先生がリードして共同実験を進めていただいたと考えています。
会話AIエージェントのプラットフォーム開発を事業化
研究成果を事業化するために大学発のスタートアップ「株式会社エキュメノポリス」を起業されたと伺っています。同社の取り組みを紹介してください。
私はもともと対話システムが専門であり、早稲田大学大学院基幹理工学研究科で博士号を取得した後、イタリア工科大学や米国カーネギーメロン大学の研究員を経て、2019年に知覚情報システム研究所の主任研究員(研究院准教授)に着任しました。帰国した当初から、研究所の研究成果を事業化するために大学発スタートアップの創業を前提にした活動をしてきました(注4)。そのような準備期間を経て、2022年5月に起業したのが株式会社エキュメノポリスで、人間とAIが豊かに共存して価値を創造できる社会モデルの提案を目指しています。
現在は会話AIエージェントサービスのプラットフォーム開発に取り組んでおり、それを応用した英会話能力判定エージェントシステムの実証実験も進めています(注5)。これは学習者の習熟度や理解度に合わせて会話を調整しながら言語能力を効果的に評価することを目的としたもので、現在、人とエージェントとの自然な会話を実現すべく研究開発が進んでいます。また、対話システム技術の社会実装やビジネスモデルの確立に向け、デジタルアニーラの活用を推進しています。
-
注4:研究グループの取り組みは、2019年度科学技術振興機構(JST)大学発新産業創出プログラム(START)や2022年度国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)シード期の研究開発型スタートアップに対する事業化支援(STS)等に採択される
-
注5:開発された英会話能力判定エージェントは、革新的な教育の取り組みを表彰する世界最大級の教育コンテストQS-Wharton Reimagine Education Award 2021におけるLearning Assessment Category(能力判定部門)にてBronze賞(銅賞)を受賞(https://www.waseda.jp/top/news/77513
)
企業と大学の双方のメリットを活かせる取り組みを目指して
今後のデジタルアニーラと共同研究に期待することはありますか。
デジタルアニーラは、人とAIが共に進化していく幅広い領域のプロセスに関する大規模社会シミュレーションに活用できると考えています。ビジネスの面ではこれからのデジタル社会に向け、デジタルアニーラのような量子インスパイアード技術も含む先端技術の本格的な社会実装を推進するために、富士通との共同研究を進めていくことを期待しています。
デジタルアニーラで解ける問題の大規模化とさらなる高速化を期待しています。今後、デジタルアニーラが第4世代、第5世代と進化していく中で、最新情報を適宜共有していただきたいと思います。
早稲田大学は幅広い領域に見識があり、驚くようなインスピレーションを私たちにもたらしてくれます。今後もデジタルアニーラの活用につながる斬新な活用方法の提案を期待しています。
企業の立場からはどうしても、顧客のニーズや課題を解決する製品やサービスをリリースすることが目的になっています。しかし大学では、成果を社会に還元することを第一に、様々な専門性を持った研究者の方々が常に議論を重ねながら研究に取り組んでおり、社会貢献につながるアイデアが出やすい環境にあると感じています。ただし、社会の現場に近いデータは大学よりも企業のほうがアクセスしやすい面もあるので、早稲田大学と富士通の共同研究をさらに推進することで相互のメリットがより拡大されると期待しています。


最後に、昨今ではSDGsも叫ばれていますが、今回の研究テーマはそうした面でどのように貢献できるでしょうか
能力を判定して語学学習を支援する英会話能力判定エージェントシステムは、SDGs目標4の「質の高い教育をみんなに」に貢献する取り組みです。また、会話AIエージェントを応用したミュージアムガイドは文化を振興して観光業を促進するなど、目標8「働きがいも経済成長も」の実現につながると考えています。
Beyond 5G時代に向け、私たちも産官学連携で「会話AIエージェントとの高臨場感インタラクション体験実現のためのXR通信基盤の研究開発」などの活動を進めていますが(注6)、こうした取り組みはまさに目標9「産業と技術革新の基盤をつくろう」に当てはまります。ミュージアムガイドのような情報空間ガイドAIは、文化遺産や自然遺産を後世に語り継ぐことで、目標11「住み続けられるまちづくりを」に寄与します。このように私たちの研究は、人とAIが豊かに共存して価値を生む、持続可能な社会の実現に貢献するものと自負しています。
-
注6:総務省/NICT Beyond 5G 2022年度 研究開発促進事業・シーズ創出型プログラムに採択される


当社のSDGsへの貢献について
2015年に国連で採択された持続可能な開発目標(Sustainable Development Goals:SDGs)は、世界全体が2030年までに達成すべき共通の目標です。当社のパーパス(存在意義)である「イノベーションによって社会に信頼をもたらし、世界をより持続可能にしていくこと」は、SDGsへの貢献を約束するものです。
本件が貢献を目指す主なSDGs

知覚情報システム研究所では、パラ言語(注1)も理解できる会話ロボットや会話プロトコルの研究に取り組んでいます。最近では「話し上手な会話AI」の実現に向け、伝えるべき情報をあらかじめ整理して準備するパーソナライズド対話シナリオ生成技術、明示的でない内容にも応答するといった気配りのできる意図理解技術、重要な情報が適切に伝わるようにメリハリを付けて話す音声合成技術などの研究開発に取り組んでいます。これらの研究は、当研究所所長の小林哲則先生らが提案した初期コンセプトに基づいて始まり、高津先生が博士論文の研究テーマで技術を実装・発展させ、さらにその技術シーズをもとに大学発スタートアップで実用化研究を進めています。