文献
J-GLOBAL ID:201702231319086012   整理番号:17A1385770

多目的強化学習のためのソフトマックス探査戦略【Powered by NICT】

Softmax exploration strategies for multiobjective reinforcement learning
著者 (3件):
資料名:
巻: 263  ページ: 74-86  発行年: 2017年 
JST資料番号: W0360A  ISSN: 0925-2312  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多目的問題への強化学習の適用における近年関心にもかかわらず,多目的文脈内で探査戦略の適用性と有効性に関する研究はほとんど行われていない。本研究では,単一目的強化学習文献から探査へのいくつかの広く使用されているアプローチを考慮し,多目的Q学習へのそれらの取込を検討した。特に本論文では,ベクトル値報酬をソフトマックス演算子を拡張する二つの新しい方法を提案した。これら探査戦略の性能を一連のベンチマーク環境で評価した。探査戦略の性能に影響するこれらのベンチマークの多目的定式化から生じる問題を同定した。は考察した手法の,楽観的初期化を有する新規ソフトマックスε探査の組合せは探査と開発の間で最も効果的なトレードオフを提供することを示した。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  その他のオペレーションズリサーチの手法 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る