抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
一般的ゲーム敷設(GGP)は,異なるゲームを実行することができる開発エージェントから成る。通常,これらのエージェントは,ゲームに関するいくつかの知識を獲得するために初期学習プロセスを通して,それをうまく実行することができる。ボードゲームにおいて,これは通常,ゲームツリーにおける多様な状態を評価する方法を学習する必要がある。本研究では,一般的なボードゲームにおける状態を評価するための価値関数を生成するためのUCT-CCNNと呼ばれる方法論を紹介した。UCT-CCNN法は,状態効用例のデータベースを生成するオフラインプロセスにおいて,ツリー(UCT)に対する上位Confidence Bounds(UCT)として知られているツリーポリシーを用いて,モンテカルロ木探索(MCTS)エージェント間の多数の整合を実行する。これらの例から,ゲーム状態に対する価値関数は,カスケード相関ニューラルネットワーク(CCNN)として知られている構成的ニューラルネットワークの使用を通して学習される。UCT-CCNN法を,2つの古典的なボードゲーム:OthelloとNine MenのMorrisでテストした。そして,得られたエージェントは,これらのゲームのために特別に開発されたエージェントに対して適合することができた。さらに,UCT-CCNN法は,得られたエージェントの強度を制御することができ,異なるレベルの困難性を有する知的エージェントを生成することができる柔軟な方法を確実にした。もう一組の実験により,UCT-CCNN法は,MCTS自身のような任意のアルゴリズムに容易に統合でき,同じ数のシミュレーションによる標準UCTと比較して,より高いwinning率をもたらすことを示した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】