認知バイアス調整機構 LS の Q 学習への実装とその機能

清水 隆宏; 横川 純貴; 甲野 佑; 高橋 達二

doi:10.11517/pjsai.JSAI2011.0_1P212in

第25回 (2011)

セッションID: 1P2-12in

DOI https://doi.org/10.11517/pjsai.JSAI2011.0_1P212in

会議情報

主催: 社団法人人工知能学会

会議名: 2011年度人工知能学会全国大会（第25回）

回次: 25

開催地: 岩手県岩手市アイーナ

開催日: 2011/06/01 - 2011/06/03

認知バイアス調整機構 LS の Q 学習への実装とその機能

*清水隆宏, 横川純貴, 甲野佑, 高橋達二

著者情報

会議録・要旨集フリー

詳細

抄録

LSモデルは篠原修二が2006年に発見した2x2分割表上に定義される確率論的な式であり、対称性・相互排他性といった人間の非論理的な推論バイアスを忠実に記述する。LSは人間の因果帰納の傾向性を最も良く記述し、また価値関数として使用すると、バンディット問題や語彙獲得、ゲーム理論において非常に高い性能を示す。本研究ではLSをQ学習におけるQ値の計算に使用することで、強化学習一般における有効性を検証する。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）