主催: システム制御情報学会
昨今の医療の電子化により、医療のドキュメントが電子的に蓄積されつつあり、蓄積されたデータへの検索の要求が高まりつつある。一般的に検索エンジンでは形態素解析を用いて索引語を作成している。一方、医療のドキュメントでは多くの専門用語が用いられており、一般的な辞書を用いて形態素解析を行っても専門用語を正確に同定することができない。そして、医療の専門用語には類義語、略語などが多く用いられ、かつ専門用語間の複合語も多く見られる。そのため、医療ドキュメントに対してどのような医療用語辞書を適用すれば、ユーザからの様々な検索要求に対応することが可能であるのか未だ判明しておらず、語数、用語共に多種多様な辞書が用いられているのが現状である。そこで本研究では、実際に医療現場で書かれた退院時サマリに対して、26万語の医療用語を収めた辞書と形態素解析器によって、解析の精度の分析を行い、医療ドキュメント検索に必要な辞書について検討した。