抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
状態または行動に関連する報酬を正確に予測するために,観察の変動性を考慮に入れる必要がある。特に,観測がノイズが多いとき,個々の報酬は平均報酬の追跡にあまり影響を持たず,平均報酬の推定は各観察後により小さな程度に更新されるべきである。しかし,観測ノイズの大きさがどのように追跡され,脳報酬システムにおける予測更新を制御するために使用されるかは知られていない。ここでは,報酬の平均と標準偏差を追跡する簡単で扱いやすい学習ルールを使用する新しいモデルを導入し,中心フィードバック信号として不確実性によってスケールされた予測誤差を活用した。価値追跡タスクにおける従来のモデルの性能と新しいモデルの性能を比較する規範的解析を提供した。新しいモデルは,様々なレベルの観測ノイズにわたって試験した場合,従来のモデルよりも利点があることを見出した。さらに,基底核回路におけるモデルの可能な生物学的実装を提案した。スケール予測誤差フィードバック信号は,報酬の大きさに関連するドーパミン予測誤差スケーリングに関する実験的発見と一致し,更新規則は線条体塑性の多くの特徴と一致することが分かった。著者らの結果は,実装,アルゴリズム,および計算のレベルにわたって,ドーパミン作動性予測誤差信号とその適応および効果的学習との関係を理解するために重要な意味を持つかもしれない。Author Summary Based Systemは,哺乳類の脳における皮質下核の収集である。このシステムは,報酬からの学習と関連する。ここで,ドーパミンは報酬予測における信号誤差と考えられる。基底核系の構造と機能は完全には理解されていないが,基底核は2つの拮抗経路に分かれるが,この分裂の理由と2つの経路の役割は不明である。さらに,いくつかの環境下では,異なるサイズの報酬が類似のサイズのドーパミン応答につながり,報酬予測誤差理論で説明できなかった。ここでは,基底核-スケール予測誤差モデルにおける学習の新しいモデルを提案した。著者らのモデルに従って,報酬平均と報酬不確実性の両方を追跡して,2つの基底核経路で表現した。次に,学習報酬不確実性を,ドーパミン作動性報酬予測誤差をスケールするために使用し,それは,報酬ノイズに対する学習適応を効果的にレンダリングする。このような学習は,非スケール予測誤差からの学習よりもロバストであり,基底核系のいくつかの生理学的特徴を説明することを示した。【JST・京大機械翻訳】