遅延フィードバックによる部分可視動的環境のための包括的オンライン学習:5G C-RAN負荷均衡のためのオンライン学習【Powered by NICT】

Shahriari Behrooz; Moh Melody; Moh Teng-Sheng

文献

J-GLOBAL ID：201702265408341237 整理番号：17A1397483

遅延フィードバックによる部分可視動的環境のための包括的オンライン学習:5G C-RAN負荷均衡のためのオンライン学習【Powered by NICT】

Generic Online Learning for Partial Visible Dynamic Environment with Delayed Feedback: Online Learning for 5G C-RAN Load-Balancer

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A1397483&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A1397483&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (3件)： , ,
資料名：
巻： 2017 号： HPCS ページ： 176-185 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習(RL)は,システムが実時間で学習と動的環境と相互作用しなければならないロボットと多くの他の領域に適用した。ほとんどの研究ではRLの重要な一部であることを状態-行動空間で定義した。深層学習法を用いたRLの統合はGoのボードゲームをマスターするような新しい挑戦的な問題を解決するために大きな飛躍をしている。エージェントに対する周囲環境は完全に可視化できない,環境は時間とともに変化することができ,その作用の受ける剤フィードバックは,変動する遅延を持つことができる。本論文では,このような環境のための包括的オンライン学習(GOL)システムを提案した。GOLは時間における抽象的特徴を形成し,最適解に適応する階層構造を持つRLに基づいている。提案した方法は,5g雲ランダムアクセスネットワークにおける負荷バランシングに適用した。シミュレーション結果は,GOLはキャッシュミスと通信負荷を低減するシステムの目的をうまく達成することを示し,少数の高レベルパターンのが必要であるのみだけで限られたシステムオーバヘッドを招く。提案したGOLアーキテクチャは動的,部分的に見える環境の将来のオンライン学習のための重要であり,多くの自律制御システムのための非常に有用であろうと信じている。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

人工知能

, , , , ,

前のページに戻る