主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
現在のコピー機構は要約モデルの一部として訓練データから暗黙的に学習されているため,どのような単語をコピーするかは明示的になっていない.そこで本研究では適切なコピーが行われるよう,あらかじめ訓練データにおける原文表現の利用個所を推定し,その推定結果を教師にコピー機構を学習する手法を提案する.さらに,文要約手法に用いられているにも関わらずコピー機構が用いられてこなかったTransformerベースのモデルにおけるコピー機構の有効性を明らかにする.要約文生成データセットGigawordにおける自動評価を用いた実験の結果,Transformerベースのモデルでもコピー機構が有効であること,そして提案する教師ありコピー機構によりTransformerベースとLSTMベースの両方のモデルで性能が向上する事が確認された.特に,Transformerベースのモデルでは最大でROUGE-1,2がそれぞれ0.30,0.28ポイント向上し,有意差がみられた.