文献
J-GLOBAL ID:201702270345890981   整理番号:17A1508286

強化学習における経験と教育の統合適応行動とフィードバック処理【Powered by NICT】

Adaptive behaviour and feedback processing integrate experience and instruction in reinforcement learning
著者 (7件):
資料名:
巻: 146  ページ: 626-641  発行年: 2017年 
JST資料番号: W3139A  ISSN: 1053-8119  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
非決定論的環境では,予期しない事象が世界における真の変化(および行動適応を必要とする)を示すまたは偶発事象を反映することができる(と割引なければならない)。適応挙動はこれらの可能性を区別する必要がある。はヒトが指導と経験からの高レベル情報を統合することによってこれを達成するか検討した。一連のEEGの実験において,命令はフィードバックの知覚情報を調節した:参加者は,新しい確率的強化学習タスクを行い,環境のフィードバックあるいは揮発性の信頼性に関する受信命令。重要なことに,我々の設計は驚きからの情報,典型的には共変をde混乱させる。行動結果は命令は負のフィードバックがより多くの情報,同時にで驚くべきもことを示した時,参加者を用いて,命令環境における変化へそれらの挙動を適合させる速くすることを示した。フィードバック予測(刺激先行陰性)とフィードバック処理(フィードバック関連陰性電位(FRN)の神経マーカーは予期せぬフィードバックの情報性を反映していることを示した最初のものである。一方,P3振幅の変化は,行動における切迫した調整を示した。まとめると,著者らの知見は,高レベル情報は柔軟な方法における経験による学習と相互作用し,ヒト学習者を可能にする新しいオプション,複雑な環境において重要な能力をがんばろまたは探索するかどうかについての意思決定を行うという新しい証拠を提供する。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
システム・制御理論一般  ,  人工知能  ,  中枢神経系 

前のページに戻る