文献
J-GLOBAL ID:202102221183272769   整理番号:21A0059404

学習済みモデルを用いた計画による,アタリ,囲碁,チェス,将棋の習得

Mastering Atari, Go, chess and shogi by planning with a learned model
著者 (15件):
資料名:
巻: 588  号: 7839  ページ: 604-609  発行年: 2020年12月24日 
JST資料番号: D0193B  ISSN: 0028-0836  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
計画能力を有するエージェントを構築することは,長きにわたり人工知能の探究における主要な課題の1つであった。ツリーベースの計画法は,チェスや囲碁などの,完璧なシミュレーターを利用できる難易度の高い領域において非常に大きな成功を収めてきた。しかし実世界の問題では,環境を支配する力学が複雑で未知であることが多い。今回我々は,ツリーベースの探索と学習済みモデルを組み合わせることによって,難易度が高く視覚的に複雑なさまざまな領域において,背景にある力学の知識を用いずに超人的性能を実現する,MuZeroアルゴリズムを提示する。MuZeroアルゴリズムは,計画に関連する予測,すなわち行動選択の方策,価値関数,報酬を生成する反復可能なモデルを学習する。アタリの57本のさまざまなゲーム(人工知能技術を検証するための標準的なビデオゲーム環境で,モデルに基づく計画手法が苦労してきた経緯がある)で評価したところ,MuZeroアルゴリズムは最高水準の性能を達成した。高性能の計画を行う標準的な環境である囲碁,チェス,将棋での評価では,MuZeroアルゴリズムは,ゲーム力学の知識を用いることなく,ゲームのルールを与えられたAlphaZeroアルゴリズムの超人的性能に匹敵する性能を示した。Copyright Nature Japan KK 2021
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
中枢神経系  ,  人工知能 

前のページに戻る