線形関数近似による無線エッジキャッシングのためのWhittleインデックスベースQ学習【JST・京大機械翻訳】

Xiong Guojun; Wang Shufan; Li Jian; Singh Rahul

プレプリント

J-GLOBAL ID：202202207593462623 整理番号：22P0295799

線形関数近似による無線エッジキャッシングのためのWhittleインデックスベースQ学習【JST・京大機械翻訳】

Whittle Index based Q-Learning for Wireless Edge Caching with Linear Function Approximation

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年02月26日プレプリントサーバーでの情報更新日： 2023年02月22日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

無線エッジでのコンテンツキャッシングの問題を考察し,制約付き無線エッジキャッシュ容量によりエンドユーザにより経験される平均待ち時間を最小化するように,信頼できない無線チャネルを介してエンドユーザ集合をサービスした。Markov決定過程としてこの問題を定式化するか,あるいは,より具体的には,解決するのが困難であった,無静止マルチアームバンド問題を定式化した。割引した対応者を調べることにより始め,閾値型の最適政策を認可することを証明した。次に,この結果も平均待ち時間問題を保持することを示した。この構造結果を用いて,この問題の指数性を確立し,平均待ち時間を最小化するためにWhitle指数ポリシーを採用した。コンテンツ要求率と無線チャネル条件のようなシステムパラメータが,しばしば未知で時変であるので,著者らは,Whitle指数政策に依存するQ^{+}-Whitleとして,さらに,モデルフリー強化学習アルゴリズムを開発した。しかしながら,Q→π+}-Whitleは,すべての状態-作用対に対してQ-関数値を貯蔵する必要があり,その数は,無線エッジキャッシングに対して極めて大きい。この目的のために,Q関数をはるかに小さい次元でパラメータ化した関数クラスにより近似し,さらに線形関数近似を持つQ→π+}-Whitleアルゴリズムを設計し,これをQ→π+}-Whitle-LFAと呼ぶ。Q^{+}-Whitle-LFAの平均二乗誤差に有限時間境界を与えた。実際のトレースを用いたシミュレーション結果は,Q^{+}-Whitle-LFAが優れた経験的性能をもたらすことを示した。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , , , , 【Automatic Indexing@JST】

無線通信一般

, , , , , ,

前のページに戻る