文献
J-GLOBAL ID:201802275742797708   整理番号:18A2073057

期待報酬ベクトルのチェビシェフスカラー化によるパレート最適方策の網羅的発見法

著者 (3件):
資料名:
巻: J101-D  号:ページ: 1276-1285 (WEB ONLY)  発行年: 2018年09月01日 
JST資料番号: U0473A  ISSN: 1881-0225  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多目的最適化問題の解法として,強化学習を導入した「多目的強化学習」が注目されている。既存手法は,各目的のQ値からなる期待報酬ベクトルの扱い方の相違から,single-policy approachとmultiple-policy approachに大別される。前者は学習中のQ値の更新ごとに各目的のQ値を重みづけし,単目的化したスカラー量を用いる方法,後者は学習中にはスカラー化せず,各目的に次状態の全ての行動に対するQ値を保持しながら,学習後に限りスカラー化する方法である。いずれも,重みづけにおいて問題に対する事前知識が必要な点や,非凸な領域に存在する解を獲得できないという問題がある。本論文は,重みづけが学習後1回でよいこと,及び,一回に複数のパレート最適方策を獲得できることから後者のアルゴリズムに着目し,非凸な領域の解も獲得できる方法を提案する。また,提案手法の有効性を二つの代表的なベンチマークを用いた実験によって評価する。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
数理計画法  ,  その他のオペレーションズリサーチの手法  ,  人工知能 
引用文献 (9件):
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る