抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,非直交多重アクセス(NOMA)支援超信頼性通信(URLLC)におけるアップリンク資源割当てを最適化するための,深い状態行動報酬状態行動(SARSA)λ学習アプローチを提案した。時変ネットワーク環境における平均復号化誤差確率を減らすために,本研究は,報酬フィードバックが瞬時ネットワーク性能に基づく長期資源配分を提供するための信頼できる学習アルゴリズムを設計した。提案したアルゴリズムの助けにより,本論文は,NOMA-URLLCネットワークにおける信頼できる資源共有の3つの主な課題に取り組んだ。1)ユーザクラスタリング;2)瞬間的フィードバックシステム;3)最適資源配分。これらの設計はすべて考察した通信環境と相互作用する。最後に,提案アルゴリズムの性能を従来のQ学習とSARSA Q学習アルゴリズムと比較した。シミュレーション結果は以下を示した。1)従来のQ学習アルゴリズムと比較して,提案した解は,10 ̄-2の長期的平均誤差を低くするために,myb200episodes内で収束できる。2)NOMA支援URLLCは,復号誤差確率に関して従来のOMAシステムより優れている。3)提案したフィードバックシステムは長期学習プロセスに対して効率的である。【JST・京大機械翻訳】