プレプリント
J-GLOBAL ID:202202203199308869   整理番号:22P0169001

脳にヒントを得た強化学習アルゴリズムの信頼性と一般化可能性について【JST・京大機械翻訳】

On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms
著者 (5件):
資料名:
発行年: 2020年07月09日  プレプリントサーバーでの情報更新日: 2020年07月09日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深いRLモデルは最小監督で様々なタイプのタスクを解決する大きな可能性を示したが,限られた経験からの学習,環境変化への適応,および単一タスクからの学習の一般化に関して,いくつかの主要な課題が残っている。決定神経科学における最近の証拠は,ヒト脳がこれらの課題を解決するための先天性能力を持ち,サンプル効率および一般化可能なRLアルゴリズムに対する神経科学にヒントを得たソリューションの開発に関する楽観主義を導くことを示した。モデルベースとモデルフリー制御を組み合わせた計算モデルは,前頭前RLを用語し,人間が学習した高レベルポリシーの情報を確実に符号化し,このモデルが学習したポリシーを広範囲のタスクに一般化できることを示した。第1に,著者らは,人間参加者が2段階Markov決定タスクを遂行する間,収集した82人の被験者のデータに関して,前頭前RLと深いRLアルゴリズムを訓練して,そこで,著者らは目標,状態遷移不確実性と状態空間複雑性を操作した。潜在挙動プロファイルとパラメータ回復性試験を含む信頼性試験において,著者らは,前頭前RLが,人間の潜在政策を確実に学習し,一方,他のすべてのモデルが失敗したことを示した。第2に,元のタスクから学習されたこれらのモデルを一般化する能力をテストするために,著者らは環境揮発性の文脈においてそれらを位置づけた。特に,潜在的文脈変数が時間とともに変化する10のMarkov決定タスクによる大規模シミュレーションを実施した。著者らの情報理論解析は,前頭前RLが適応性の最も高いレベルとエピソード符号化有効性を示したことを示した。これは,脳が一般的問題を解決する方法を模倣する計算モデルが,機械学習における重要課題に対する実用的な解決策を導くことができる可能性について形式的にテストする最初の試みである。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る