連続時間Markovジャンプ線形システムのオンライン強化学習マルチプレーヤ非ゼロ和ゲーム【JST・京大機械翻訳】

Xin Xilin; Tu Yidong; Stojanovic Vladimir; Wang Hai; Shi Kaibo; He Shuping; Pan Tianhong

文献

J-GLOBAL ID：202102253299963206 整理番号：21A2988036

連続時間Markovジャンプ線形システムのオンライン強化学習マルチプレーヤ非ゼロ和ゲーム【JST・京大機械翻訳】

Online reinforcement learning multiplayer non-zero sum games of continuous-time Markov jump linear systems

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=21A2988036&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=21A2988036&from=J-GLOBAL&jstjournalNo=D0568B") }}

著者 (7件)：

Xin Xilin

Xin Xilin について

名寄せID(JGPN) 202250000771768153 ですべてを検索
「Xin Xilin」ですべてを検索

(Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China)

Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China について

名寄せID(JGON) 201551000076617348 ですべてを検索
「Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China」ですべてを検索

Tu Yidong

Tu Yidong について

名寄せID(JGPN) 202150000715791234 ですべてを検索
「Tu Yidong」ですべてを検索

(Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China)

Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China について

名寄せID(JGON) 201551000076617348 ですべてを検索
「Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China」ですべてを検索

Stojanovic Vladimir

Stojanovic Vladimir について

名寄せID(JGPN) 202050000651615766 ですべてを検索
「Stojanovic Vladimir」ですべてを検索

(Department of Automatic Control, Robotics and Fluid Technique, Faculty of Mechanical and Civil Engineering, University of Kragujevac, Kraljevo 36000, Serbia)

Department of Automatic Control, Robotics and Fluid Technique, Faculty of Mechanical and Civil Engineering, University of Kragujevac, Kraljevo 36000, Serbia について

名寄せID(JGON) 201551000086151398 ですべてを検索
「Department of Automatic Control, Robotics and Fluid Technique, Faculty of Mechanical and Civil Engineering, University of Kragujevac, Kraljevo 36000, Serbia」ですべてを検索

Wang Hai

Wang Hai について

名寄せID(JGPN) 201550000020321124 ですべてを検索
「Wang Hai」ですべてを検索

(Discipline of Engineering and Energy, Murdoch University, 90 South Street, Murdoch, WA 6150, Australia)

Discipline of Engineering and Energy, Murdoch University, 90 South Street, Murdoch, WA 6150, Australia について

名寄せID(JGON) 201751000115796438 ですべてを検索
「Discipline of Engineering and Energy, Murdoch University, 90 South Street, Murdoch, WA 6150, Australia」ですべてを検索

Shi Kaibo

Shi Kaibo について

名寄せID(JGPN) 201401100140107177 ですべてを検索
「Shi Kaibo」ですべてを検索

(School of Electronic Information and Electrical Engineering, Chengdu University, Chengdu 610106, China)

School of Electronic Information and Electrical Engineering, Chengdu University, Chengdu 610106, China について

名寄せID(JGON) 201651000113363022 ですべてを検索
「School of Electronic Information and Electrical Engineering, Chengdu University, Chengdu 610106, China」ですべてを検索

He Shuping

He Shuping について

名寄せID(JGPN) 201750000360308690 ですべてを検索
「He Shuping」ですべてを検索

(Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China)

Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China について

名寄せID(JGON) 201551000076617348 ですべてを検索
「Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China」ですべてを検索

Pan Tianhong

Pan Tianhong について

名寄せID(JGPN) 202250000770336098 ですべてを検索
「Pan Tianhong」ですべてを検索

(Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China)

Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China について

名寄せID(JGON) 201551000076617348 ですべてを検索
「Key Laboratory of Intelligent Computing and Signal Processing (Ministry of Education), School of Electrical Engineering and Automation, Anhui University, Hefei 230601, China」ですべてを検索

資料名：

Applied Mathematics and Computation (Applied Mathematics and Computation)

Applied Mathematics and Computation について

JST資料番号 D0568B ですべてを検索
ISSN,ISBN,CODENですべてを検索
資料情報を見る

巻： 412 ページ： Null 発行年： 2022年
JST資料番号： D0568B ISSN： 0096-3003 CODEN： AMHCBQ 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：オランダ (NLD) 言語：英語 (EN)

抄録/ポイント：

抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

本論文では,多層非ゼロ和ゲームを解くために,新しいオンラインモードフリー積分強化学習アルゴリズムを提案した。まず,状態と入力のサブシステム情報を収集し,学習する。次に,オンライン学習を用いて,対応するN結合代数Riccati方程式を計算した。本論文で提案した政策反復アルゴリズムは,多重層非ゼロ和ゲームに対応する結合代数Riccati方程式を解くことができる。最後に,本論文の設計法の有効性と実現可能性を,3つのプレーヤーによるシミュレーション用例によって証明した。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

シソーラス用語：

シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ（有料）でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

シミュレーション

シミュレーションについて

「シミュレーション」ですべてを検索
この用語の用語情報を見る

*線形系

線形系について

「線形系」ですべてを検索
この用語の用語情報を見る

*非ゼロ和ゲーム

非ゼロ和ゲームについて

「非ゼロ和ゲーム」ですべてを検索
この用語の用語情報を見る

多層

多層について

「多層」ですべてを検索
この用語の用語情報を見る

有効性

有効性について

「有効性」ですべてを検索
この用語の用語情報を見る

*連続時間系

連続時間系について

「連続時間系」ですべてを検索
この用語の用語情報を見る

*強化学習

強化学習について

「強化学習」ですべてを検索
この用語の用語情報を見る

学習アルゴリズム

学習アルゴリズムについて

「学習アルゴリズム」ですべてを検索
この用語の用語情報を見る

準シソーラス用語：

オンライン学習

オンライン学習について

「オンライン学習」ですべてを検索
この用語の用語情報を見る

サブシステム

サブシステムについて

「サブシステム」ですべてを検索
この用語の用語情報を見る

反復アルゴリズム

反復アルゴリズムについて

「反復アルゴリズム」ですべてを検索
この用語の用語情報を見る

プレイヤ

プレイヤについて

「プレイヤ」ですべてを検索
この用語の用語情報を見る

*オンライン

オンラインについて

「オンライン」ですべてを検索
この用語の用語情報を見る

設計法

設計法について

「設計法」ですべてを検索
この用語の用語情報を見る

代数Riccati方程式

代数Riccati方程式について

「代数Riccati方程式」ですべてを検索
この用語の用語情報を見る

, 【Automatic Indexing@JST】

著者キーワード (4件)：

強化学習

強化学習について

「強化学習」ですべてを検索
この用語の用語情報を見る

Markovジャンプ線形システム

Markovジャンプ線形システムについて

「Markovジャンプ線形システム」ですべてを検索

マルチプレーヤ非ゼロ和ゲーム

マルチプレーヤ非ゼロ和ゲームについて

「マルチプレーヤ非ゼロ和ゲーム」ですべてを検索

結合代数Riccati方程式

結合代数Riccati方程式について

「結合代数Riccati方程式」ですべてを検索

分類 (2件)：

分類
JSTが定めた文献の分類名称とコードです

人工知能

(JE08000Z)

人工知能について

分類コード JE08000Z で文献を検索
分類コード4桁 JE08 で文献を検索

, システム設計・解析

(IA02030D)

システム設計・解析について

分類コード IA02030D で文献を検索
分類コード4桁 IA02 で文献を検索

タイトルに関連する用語 (8件)：

タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

連続時間

連続時間について

「連続時間」ですべてを検索
この用語の用語情報を見る

ジャンプ

ジャンプについて

「ジャンプ」ですべてを検索
この用語の用語情報を見る

線形システム

線形システムについて

「線形システム」ですべてを検索
この用語の用語情報を見る

オンライン

オンラインについて

「オンライン」ですべてを検索
この用語の用語情報を見る

強化学習

強化学習について

「強化学習」ですべてを検索
この用語の用語情報を見る

マルチ

マルチについて

「マルチ」ですべてを検索
この用語の用語情報を見る

プレーヤ

プレーヤについて

「プレーヤ」ですべてを検索
この用語の用語情報を見る

非ゼロ和ゲーム

非ゼロ和ゲームについて

「非ゼロ和ゲーム」ですべてを検索
この用語の用語情報を見る

前のページに戻る