抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層強化学習(DRL)の最近の進歩は,人間を既知で良く定義された環境で置き換える目的で,エージェントの性能の改善に主に焦点を合わせている。ビデオゲーム生産のためのゲーム設計ツールとしてのこれらの技術の利用は,目的が非Player Character(NPC)行動を創造する代わりに,最近までほとんど注目されていない。例えば,Rogue様のようなTurnベース戦略ゲームは,DRLに対するユニークな挑戦を示す。特に,異なる属性を持つ多くのエンティティから成るそれらの複雑なゲーム状態のカテゴリー的性質は,これらのエンティティを比較し,優先順位付けする方法を学習できるエージェントを必要とする。さらに,この複雑性はしばしば訓練中に見られる状態に適合するエージェントにつながり,開発中に作られた設計変更の面で一般化できない。本論文では,手続きロット生成システムと組み合わせた2つのネットワークアーキテクチャを提案し,複雑なカテゴリ状態空間をより良く処理でき,設計決定により強制される再訓練の必要性を緩和することができる。第一は,離散観測モデルを抽象化し,訓練されたエージェントをより一般化できる,カテゴリ入力空間の密な埋込みに基づいている。第2の提案アーキテクチャは,より一般的であり,入力と入力属性を関係づけることができる変換ネットワークに基づいている。著者らの実験的評価は,新エージェントがベースラインアーキテクチャに関してより良い適応能力を持ち,このフレームワークが開発中の動的ゲームプレイ変化に対してよりロバストであることを示した。本論文で示した結果に基づいて,これらの解決策は,ゲーム産業にアクセスできるDRLを作るためのステップを前進させると信じる。【JST・京大機械翻訳】