文献
J-GLOBAL ID:202202221445612867   整理番号:22A0984839

線形関数近似による差分プライベート強化学習【JST・京大機械翻訳】

Differentially Private Reinforcement Learning with Linear Function Approximation
著者 (1件):
資料名:
巻:号:ページ: 1-27  発行年: 2022年 
JST資料番号: W5682A  ISSN: 2476-1249  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実世界の個人化されたサービスにおける強化学習(RL)の幅広い採用によって動機づけられて,ユーザの感受的で個人的な情報が保護される必要があるので,著者らは,差分プライバシー(DP)の制約の下で有限水平Markov決定プロセス(MDP)におけるレグレット最小化を研究する。表の有限状態,有限行動MDPsだけで動作する既存の私的RLアルゴリズムと比較して,著者らは,大きな状態と行動空間を有するMDPsにおけるプライバシー保護学習に向けて最初のステップを取り入れた。特に,著者らは,RLエージェントがユーザの敏感なデータを保護するために責任がある,結合微分プライバシー(JDP)の概念の下で,線形関数近似(特に線形混合MDPs)を有するMDPsを考察した。著者らは,それぞれ価値反復と政策最適化に基づく2つの私的RLアルゴリズムを設計して,それらがプライバシー保護を保証する間,それらがサブ線形レグレット性能を楽しむことを示した。さらに,レグレット限界は,状態数に無関係であり,そして,行動の数とともに,ほとんどの対数的にスケールは,今日の大規模個人化サービスにおけるプライバシー保護に適したアルゴリズムを作る。結果は,非プライベート学習に対する以前の結果を一般化するだけでなく,一般的な私的強化学習のためのビルディングブロックとしても役立った,変化する正則化器の下で線形混合MDPにおける学習のための一般的手順によって達成される。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る