抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
無線エッジでのコンテンツキャッシングの問題を考察し,制約付き無線エッジキャッシュ容量によりエンドユーザにより経験される平均待ち時間を最小化するように,信頼できない無線チャネルを介してエンドユーザ集合をサービスした。Markov決定過程としてこの問題を定式化するか,あるいは,より具体的には,解決するのが困難であった,無静止マルチアームバンド問題を定式化した。割引した対応者を調べることにより始め,閾値型の最適政策を認可することを証明した。次に,この結果も平均待ち時間問題を保持することを示した。この構造結果を用いて,この問題の指数性を確立し,平均待ち時間を最小化するためにWhitle指数ポリシーを採用した。コンテンツ要求率と無線チャネル条件のようなシステムパラメータが,しばしば未知で時変であるので,著者らは,Whitle指数政策に依存するQ^{+}-Whitleとして,さらに,モデルフリー強化学習アルゴリズムを開発した。しかしながら,Q→π+}-Whitleは,すべての状態-作用対に対してQ-関数値を貯蔵する必要があり,その数は,無線エッジキャッシングに対して極めて大きい。この目的のために,Q関数をはるかに小さい次元でパラメータ化した関数クラスにより近似し,さらに線形関数近似を持つQ→π+}-Whitleアルゴリズムを設計し,これをQ→π+}-Whitle-LFAと呼ぶ。Q^{+}-Whitle-LFAの平均二乗誤差に有限時間境界を与えた。実際のトレースを用いたシミュレーション結果は,Q^{+}-Whitle-LFAが優れた経験的性能をもたらすことを示した。【JST・京大機械翻訳】