応用統計学
Online ISSN : 1883-8081
Print ISSN : 0285-0370
ISSN-L : 0285-0370
研究ノート
アウトカム情報を利用した細菌データに対する ノンパラメトリックベイズトピックモデル
奥井 佑
著者情報
ジャーナル フリー

2019 年 48 巻 1-2 号 p. 1-16

詳細
抄録

近年,細菌の検出数を示す16S rRNAデータを用いて, 疾患等の臨床アウトカムと関連する菌種を 特定する統計解析が広く行われるようになった. それに対応して解析手法も多く提案されるようになり, 解析手法の一つとして潜在ディリクレ配分モデル(LDA)が用いられている. 教師情報を利用したLDAとして, 教師ありトピックモデル(SLDA)やディリクレ多項回帰モデルを 伴うLDA(DMR)が提案されている一方で, それら手法は細菌データに対して応用されていないとともに, 一定の割合を持つトピックが抽出されないことが多くある. これら問題に対処するため,本研究ではDMRを 拡張したノンパラメトリックベイズトピックモデルを提案し, 既存のDMRやSLDAと予測性能を比較評価した. ノンパラメトリックベイズモデルでは, 潜在変数について無限の値を仮定し, 各潜在クラスが占める割合に傾斜性を 持たせることが可能となる.本研究では共変量値を もとに棒折り過程を生成する手法を トピックモデルに応用することで,共変量と関連するトピックを 抽出するノンパラメトリックベイズトピックモデルを考案した. 提案法について実際の細菌データに適用し性能を 評価したところ,トピック割合が比較的大きくなおかつ アウトカムと関連するトピックが抽出されるとともに, アウトカムに対して既存の手法を上回る予測性能を 持つことが示された.

著者関連情報
© 2018 応用統計学会
feedback
Top