抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
リカレントニューラルネットワークとして表現される制御ポリシーを理解するためのアプローチを紹介した。最近の研究は,そのようなリカレントポリシーネットワークを有限状態マシン(FSM)に変換することによりこの問題に近づき,次に等価最小化FSMを解析する。これは興味深い洞察をもたらしたが,最小化プロセスは意味的に異なる状態による機械の操作のより深い理解を不明瞭にする。この問題に取り組むために,非最小化FSMで開始し,政策の重要な決定点を保存するより解釈可能な削減を適用する解析手法を導入した。また,決定における観察の役割のより深い理解を得るための注意ツールも貢献する。7つのAtariゲームと3つの制御ベンチマークに関する事例研究は,アプローチが以前には注目されていない洞察を明らかにすることができることを証明した。【JST・京大機械翻訳】