リカレントポリシーネットワークの再理解有限状態表現【JST・京大機械翻訳】

Danesh Mohamad H.; Koul Anurag; Fern Alan; Khorram Saeed

プレプリント

J-GLOBAL ID：202202211809875127 整理番号：21P0034488

リカレントポリシーネットワークの再理解有限状態表現【JST・京大機械翻訳】

Re-understanding Finite-State Representations of Recurrent Policy Networks

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2020年06月05日プレプリントサーバーでの情報更新日： 2021年07月11日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

リカレントニューラルネットワークとして表現される制御ポリシーを理解するためのアプローチを紹介した。最近の研究は,そのようなリカレントポリシーネットワークを有限状態マシン(FSM)に変換することによりこの問題に近づき,次に等価最小化FSMを解析する。これは興味深い洞察をもたらしたが,最小化プロセスは意味的に異なる状態による機械の操作のより深い理解を不明瞭にする。この問題に取り組むために,非最小化FSMで開始し,政策の重要な決定点を保存するより解釈可能な削減を適用する解析手法を導入した。また,決定における観察の役割のより深い理解を得るための注意ツールも貢献する。7つのAtariゲームと3つの制御ベンチマークに関する事例研究は,アプローチが以前には注目されていない洞察を明らかにすることができることを証明した。【JST・京大機械翻訳】

, , , , ,
, , 【Automatic Indexing@JST】

ニューロコンピュータ , 電力系統一般

前のページに戻る