生成文字数の調整が可能なニューラル要約技術を開発

自然言語処理の国際会議 ACL 2019 で発表

2019年7月24日

ニュースや記事の配信では、紙以外にもWebやSNSなど多様化が進み、媒体によっては文字数の制限があり記事の要約が必要です。今回、字数制限内の要約を効率的に生成するためのニューラル要約技術を開発しました。本技術は要約の字数制限の制御において、強化学習を応用した学習手法を提案し、字数制限を超える要約生成の割合が従来手法の約1/4という大幅な改善に成功しました。また、要約の自動生成が字数制限内になったことで、自動生成した要約結果を人手で修正する時間が約30%削減することを確認しました。

人工知能研究所 デジタルナレッジプロジェクト 牧野 拓哉 研究員人工知能研究所 デジタルナレッジプロジェクト 牧野 拓哉 研究員

開発の背景

本技術の開発以前にも、ニューラル要約モデルにおける要約字数の制御手法が提案されてきました。しかし、我々の予備実験では、従来の手法で生成される要約の約30%が字数制限を超えており、新幹線の電光掲示板に流れる要約を始めとした、字数制限を厳密に守らなければならないアプリケーションへの実適用では、さらなる改善が求められていました。

技術の特徴

ニューラル要約モデルに基づく生成型要約手法は、記事中から重要な文を選択して要約を作成する抽出型要約手法とは異なります。この従来の手法では、編集者が実際に新聞記事から要約を作成する際にみられる、言い換え(例えばアメリカを米と短くする)や語順の変化、不要な単語の削除といった編集作業に対応できます。しかし、生成される要約の長さの制御において改善の余地がありました。

そこで、本技術では長さ制約内で要約を生成するため、ニューラル要約モデルの学習方法として、強化学習の一種を用いて要約モデルを学習する方法を提案しました。本学習方法では、モデルが生成した要約に対し、従来の学習方法で用いられていた品質の評価に加え、長さ制約内であるかの評価も考慮しています。そのため、仮に品質が高くても、長さ制約を超えていれば低い評価を与えることが可能となりました。結果、長さ制約内で品質の高い要約を生成することに成功しました。

図1.字数を調整可能にするニューラル要約技術図1.字数を調整可能にするニューラル要約技術

関連情報

※本技術は自然言語処理で最も権威のある国際会議 ACL 2019 に採択されました。

※抽出型要約、生成型要約による自動要約のデモサイトを公開中(2019年7月時点では特定の新聞社へのみ公開)

本件に関するお問合せ

acl2019-summarization@ml.labs.fujitsu.com

ページの先頭へ