OpenAI Gymにおける未もつれ量子強化学習エージェント【JST・京大機械翻訳】

Hsiao Jen-Yueh; Du Yuxuan; Chiang Wei-Yin; Hsieh Min-Hsiu; Goan Hsi-Sheng

プレプリント

J-GLOBAL ID：202202210574838796 整理番号：22P0310998

OpenAI Gymにおける未もつれ量子強化学習エージェント【JST・京大機械翻訳】

Unentangled quantum reinforcement learning agents in the OpenAI Gym

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年03月27日プレプリントサーバーでの情報更新日： 2022年03月27日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

古典的強化学習(RL)は,異なる領域で優れた結果を生み出した。しかし,その試料の非効率性は重要な問題のままである。本論文では,量子RLのサンプル効率(収束速度)が古典的RLのそれよりも良く,同等の学習性能を達成するために,量子RLは古典的RLよりも訓練可能なパラメータ(少なくとも1桁)を多く使用できることを示した。特に,OpenAI GymにおけるRLのポピュラーなベンチマーク環境を採用し,著者らの量子RLエージェントが,同じ最適化プロセスの下で,CartPoleとAcロボットのタスクにおいて,古典的完全接続ニューラルネットワーク(FCN)より速く収束することを示した。また,OpenAI GymにおけるLunarLanderのタスクを完了できる最初の量子RLエージェントを訓練することに成功した。量子RLエージェントは,ゲートをエンタングルすることなく単一量子ビットベースの変分量子回路のみを必要とし,次に,測定出力を後処理するために古典的ニューラルネットワーク(NN)が続く。最後に,著者らは実際のIBM量子マシンに関する前述のタスクを達成することができた。著者らが知る限りでは,以前の量子RLエージェントのどれも,そうではない。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

人工知能

, ,

前のページに戻る