人工知能学会全国大会論文集
Online ISSN : 2758-7347
第25回 (2011)
セッションID: 1P2-12in
会議情報

認知バイアス調整機構 LS の Q 学習への実装とその機能
*清水 隆宏横川 純貴甲野 佑高橋 達二
著者情報
会議録・要旨集 フリー

詳細
抄録

LSモデルは篠原修二が2006年に発見した2x2分割表上に定義される確率論的な式であり、対称性・相互排他性といった人間の非論理的な推論バイアスを忠実に記述する。LSは人間の因果帰納の傾向性を最も良く記述し、また価値関数として使用すると、バンディット問題や語彙獲得、ゲーム理論において非常に高い性能を示す。本研究ではLSをQ学習におけるQ値の計算に使用することで、強化学習一般における有効性を検証する。

著者関連情報
© 2011 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top