プレプリント
J-GLOBAL ID:202202210117913073   整理番号:22P0027271

強化学習のための臨界ベース可変ステップ数アルゴリズム【JST・京大機械翻訳】

Criticality-Based Varying Step-Number Algorithm for Reinforcement Learning
著者 (2件):
資料名:
発行年: 2022年01月13日  プレプリントサーバーでの情報更新日: 2022年01月13日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習の文脈において,状態の重要性の概念を導入し,特定の状態における行動の選択が期待したリターンに影響する程度を示した。すなわち,行動の選択が最終結果に影響する可能性が高い状態は,最終結果に影響する可能性が低い状態よりも,より重要であると考えられる。著者らは,人間によって提供される臨界関数を利用するか,または環境から直接学習された柔軟性ステップ数アルゴリズムである臨界ベース変化ステップ数アルゴリズム(CVS)を定式化した。Atari Pong環境,道路-Tree環境,およびShoter環境を含む3つの異なる領域で試験した。CVSは,深いQ学習やモンテカルロのような一般的な学習アルゴリズムを凌駕できることを実証する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る