カリキュラム学習を用いた迷路の経路形状制御手法

星野貴彦; 三宅陽一郎

文献

J-GLOBAL ID：202302229921422143 整理番号：23A3109336

カリキュラム学習を用いた迷路の経路形状制御手法

Path shape generation control in a maze by using curriculum learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=23A3109336&from=J-GLOBAL&jstjournalNo=U1701A") }}

著者 (2件)： ,
資料名：
巻： 37th ページ： ROMBUNNO.3Xin4-79(J-STAGE) 発行年： 2023年
JST資料番号： U1701A ISSN： 2758-7347 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

本研究では,迷路の最短経路の形状をPCGRL(Procedural Contents Generation via Reinforcement Learning,強化学習によるコンテンツ自動生成)に加えてカリキュラム学習を適用する生成手法を提案し,その結果の報告を行う。PCGRLとは,レベルデザインの問題をゲームと捉えて,コンテンツ生成器を強化学習で学習させる手法である。今回は,迷路の最短経路の形状が渦巻型になることを目標として制御を行う。これは一定の面積と条件の中で最も長い経路は渦巻型を取ると予想されるからである。提案する手法の詳細としては,強化学習における報酬関数を,最短経路が渦巻型に近いほど報酬を多く与えるように設定し,タスクの達成度合いに応じて迷路のゴール位置を渦巻状に移動させ,PCGRLのフレームワークを用いて学習し,迷路を渦巻型に制御することで,カリキュラム学習が有効であるかを検証した。結果としては,安定して報酬値を増加させることができたが,タスク更新時の適切な難易度設定や条件といった課題がある。(著者抄録)

, , , , , , , ,

人工知能 , その他の情報処理

, , , ,

前のページに戻る