文献
J-GLOBAL ID:202002216938879853   整理番号:20A0433452

実時間戦略ゲームにおける操縦エージェントの目的地を認識するための逆強化学習による半Markov決定モデル【JST・京大機械翻訳】

A Semi-Markov Decision Model With Inverse Reinforcement Learning for Recognizing the Destination of a Maneuvering Agent in Real Time Strategy Games
著者 (4件):
資料名:
巻:ページ: 15392-15409  発行年: 2020年 
JST資料番号: W2422A  ISSN: 2169-3536  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
操作エージェントの目的を認識することは,リアルタイム戦略(RTS)ゲームにおける知的AIプレイヤーを作成するために重要である。問題定式化の異なる方法の中で,目標認識は,オフシェルプランナを用いたモデルベースの計画問題として解くことができる。しかし,これらのフレームワークにおける一般的な問題は,通常,現実世界のシナリオにおけるように,エージェントがグリッド間を移動するためのいくつかのステップを取る可能性があるので,それらが通常,行動継続時間のモデリングを欠いていることである。この問題を解決するために,本論文では,行動の継続時間を明示的にモデル化する半Markov決定モデル(SMDM)を提案した。その上,ほとんどの現在の研究は同定された人の行動モデルを確立していない。そして,認識結果の精度を制限する個々の行動選好をモデル化する研究はほとんどない。本論文において,逆強化学習(IRL)方法を,目的認識問題のための反対の挙動学習において採用した。動的環境に適応するために,最大エントロピー逆強化学習(MaxEnt IRL)法を,重みづけの影響を測定するためにFitness指数を定義することによって変換して,最適重みを見つけるためにNelder-Mead多面体探索を使用した。実験において,著者らは,著者らの方法の性能を評価するために,いくつかの異なるタスクにおいて,人間のプレイヤーからの移動軌跡を収集することができる,Un実エンジン4環境におけるゲームシナリオを構築した。結果は,IRLを使用する認識装置が,中間の間,意図が変化しても,効果的に目的地を認識することができることを示して,それは,いくつかの最も頻繁に使用された計量の観点から,他のモデルより良く機能する。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  数値計算 

前のページに戻る