第83回 談話会 (2012年7月11日/グローバルCOE 第51回 若手の会談話会)
強化の反応増強効果と反応形成効果
丹野 貴行 氏(関西学院大学、日本学術振興会特別研究員PD)
今回の若手の会では、関西学院大学の丹野先生に「強化の反応増強効果と反応形成効果」という演題でご講演いただいた。強化とは、ここではオペラント学習を成立させる際に当人に報酬を与え(強化子)行動を強めることを言うが、丹野先生は、強化と反応においての関係に着目をし、強化頻度と強化スケジュール(オペラント行動と強化のされ方との関係)が反応に与える影響についてのお話を伺った。
はじめに、学習心理学の歴史的な背景を、ベンサムの「快楽が全ての行為を決定する」という快楽主義や、バークリーやヒュームによる「知識の源は観念と観念の連合である」という連合主義、パブロフやソーンダイクによる連合学習「観念から刺激と反応へ」、スキナーによる連合学習の分類(条件反射、試行錯誤学習を、レスポンデント条件付けとオペラント条件付けに分類をした)を取り上げてご説明された。このような歴史的背景の中で、オペラント条件付けは、強化頻度が高いほど強い連合を示す「マッチングの法則」が成り立つことが言われている一方で、強化スケジュール(オペラント行動と強化のされ方との関係)を操作するとこの原理が成立しないことが確認されることを示された。
例えば、強化頻度を揃えて、VR(variable ratio:強化が決まった反応回数ごとにされるのではなく、不規則になされる方法)とVI(variable interval:前の強化からある時間が過ぎた最初の行動を強化する方法ではあるが、その時間を一定させない仕方)強化スケジュールの2条件間での反応率差をみると、常にVRスケジュールで高い反応率を示すことが確認されている。これはマッチングの原理への疑問を生むとし、丹野先生はこの疑問に対し、強化子呈示を伴った反応間時間が強化されるIRT強化理論と、反応率と強化率の関係に基づく最適反応率を導く最適化理論の2つの理論的説明のどちらがより過去の実験データを支持するのかをご検討され、その結果、IRT強化理論がよりデータとの適合性があり、オペラント条件付けでの強化では、最適化よりも接近性(反応と強化の時間の近さ)が重要であることを立証した。さらに丹野先生は、このIRT理論に遅延強化とChoice Tagを導入したCpyinstモデルによって反応増強化(時間配分)と反応形成効果(局所)を明示的に分離し、そのうえで強化頻度は反応増強に、強化スケジュールは反応形成に関与していることを示された。
以上本講演では、 Copyistモデルがこれまでのデータを包括的に説明できることをシミュレーションによって示すことで、強化の効果に迫る新たな示唆が与えられた。丹野先生の実験と理論を組み合わせた方法を用い力強く仮説を検証していく姿勢は、計算論的神経科学という立場から研究を進めている我々にとっても大きな刺激を与えてくれるものであった。
日時 | 2012年7月11日(水)17:00〜18:30 |
---|---|
場所 | 玉川大学研究センター棟 1階101演習室 |
報告者 | 野々村 聡(玉川大学大学院 脳情報研究科) |