抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習(RL)は,システムが実時間で学習と動的環境と相互作用しなければならないロボットと多くの他の領域に適用した。ほとんどの研究ではRLの重要な一部であることを状態-行動空間で定義した。深層学習法を用いたRLの統合はGoのボードゲームをマスターするような新しい挑戦的な問題を解決するために大きな飛躍をしている。エージェントに対する周囲環境は完全に可視化できない,環境は時間とともに変化することができ,その作用の受ける剤フィードバックは,変動する遅延を持つことができる。本論文では,このような環境のための包括的オンライン学習(GOL)システムを提案した。GOLは時間における抽象的特徴を形成し,最適解に適応する階層構造を持つRLに基づいている。提案した方法は,5g雲ランダムアクセスネットワークにおける負荷バランシングに適用した。シミュレーション結果は,GOLはキャッシュミスと通信負荷を低減するシステムの目的をうまく達成することを示し,少数の高レベルパターンのが必要であるのみだけで限られたシステムオーバヘッドを招く。提案したGOLアーキテクチャは動的,部分的に見える環境の将来のオンライン学習のための重要であり,多くの自律制御システムのための非常に有用であろうと信じている。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】