文献
J-GLOBAL ID:202202231301519783   整理番号:22A0780635

時変結合制約とバンディットフィードバックによる分散凸最適化のためのオンライン学習アルゴリズム【JST・京大機械翻訳】

Online Learning Algorithm for Distributed Convex Optimization With Time-Varying Coupled Constraints and Bandit Feedback
著者 (4件):
資料名:
巻: 52  号:ページ: 1009-1020  発行年: 2022年 
JST資料番号: W0791A  ISSN: 2168-2267  CODEN: ITCEB8  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,エージェントのグループが時変結合制約を受ける時間変化局所コスト関数の和を協調的に最適化することを目的とする動的環境におけるマルチエージェント分散制約最適化問題に焦点を当てた。局所コスト関数と制約関数の両者は,行動が提出されるまで個々のエージェントに再生されない。最初に,各エージェントが選択した行動でそれ自身が所有するコスト関数と制約関数の値と勾配の両方にアクセスすることができる勾配フィードバックシナリオを研究した。次に,著者らは,分散プライムドワルド二重オンライン学習アルゴリズムを設計し,提案したアルゴリズムが,レグレットと制約違反の両方に対して,サブ線形限界を達成できることを示した。さらに,勾配フィードバックアルゴリズムを勾配フリーセットアップに拡張し,そこでは,個々のエージェントが,選択された行動近くの2つの質問点における局所コスト関数と制約関数の値のみを達成した。著者らは,以前の方法のバンドバージョンを開発し,期待したレグレットと予想される制約違反に関する明示的なサブ線形限界を与えた。結果は,帯域アルゴリズムが,野生条件の下で勾配フィードバックアルゴリズムと同じ性能を達成できることを示した。最後に,電気自動車充電問題に関する数値シミュレーションは,提案したアルゴリズムの有効性を実証した。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る