Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第9回研究会
会議情報

セッション5:テキスト処理
単語の分散表現及びtf-idf法を用いた自動要約システム
原田 大地荒木 健治
著者情報
キーワード: 文書要約, tf-idf, Word2Vec
会議録・要旨集 フリー

p. 49-50

詳細
抄録

本手法では,tf-idf値と単語の分散表現の類似度を用いてスコアを計算することにより文の重要度を決定し,要約を行う.具体的には,tf-idf値により重要と判定された単語に加えて,この重要語と類似した単語もまた重要語とみなし,重要語のtf-idf値と分散表現のコサイン類似度との積を重要語のスコアとする.次に,文中に含まれる重要語のスコアの総和を文長により正規化することにより得られた文の重要度スコアを用いて重要文抽出による単一文書要約を行う.本発表では,本手法に基づく実験システムを作成し,日本語のニュース記事を対象として評価実験および考察を行った結果について述べる.

著者関連情報
2016 この論文のすべての権利と著作権は著者に帰属します。
前の記事 次の記事
feedback
Top