状態空間のt-SNE次元削減による強化学習エージェントの戦術の可視化

長友結希; 三宅陽一郎

文献

J-GLOBAL ID：202202211218467330 整理番号：22A1920855

状態空間のt-SNE次元削減による強化学習エージェントの戦術の可視化

Visualizing tactics of reinforcement learning agents through t-SNE dimensionality reduction in state space

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A1920855&from=J-GLOBAL&jstjournalNo=U1701A") }}

著者 (2件)： ,
資料名：
巻： 36th ページ： ROMBUNNO.4E1-GS-2-02(J-STAGE) 発行年： 2022年
JST資料番号： U1701A ISSN： 2758-7347 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

本研究は強化学習におけるエージェントのとる戦術の可視化による,強化学習の説明可能性の検証を目的とする.昨今の強化学習の目覚ましい発展により,強化学習エージェントは高度な判断能力を備えたロボットのように振る舞うことができる.ただし強化学習エージェントは一般的に学習過程の詳細な追跡が困難であり,どのような判断によりその行動を取るのかは不明瞭である.しかし,エージェントが置かれた空間上の状態とその時間軸上の遷移を観察することによって,一連の行動を取るに至るパターンを見出すことができる.だが,時空間上に存在する無数の状態変数がどのようにパターンを形成するのかを分析することは,次元の呪いにとらわれ容易ではない.本研究では繰り返し観測される一連の行動群を戦術と見なし可視化し分析する.具体的には,エージェントの平面空間上での軌跡を取り,軌跡をt-SNEによる次元削減をすることで分析を行った.これによりエージェントの行動がいくつかのパターンに分類され,同一の戦術を繰り返し利用していることを可視化することに成功した.(著者抄録)

, , , , , ,
, ,

人工知能 , 図形・画像処理一般

, , , , ,

前のページに戻る