抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,重い尾のマルチアームバンドビットの概念を敵対的環境へ一般化し,損失がσ ̄αによって有界のα-th(1<α≦2)モーメントを持つ,一方,分散は存在しなかった,重い尾のマルチアームバンド(MAB)のためのロバスト最良-世界アルゴリズムを開発した。特に,重いテールパラメータαとσがエージェントに知られているとき,アルゴリズムHTINFを設計して,HTINFは,実際の環境タイプアプリオリを知らなくても,確率的および敵対的環境の両方に対して最適レグレットを達成した。α,σが未知である場合,HTINFは確率的事例でlogTスタイルインスタンス依存レグレットを,敵対事例ではo(T)非レギュア保証をachi受する。さらに,アルゴリズムAdaTINFを開発し,αとσに関する事前知識なしに,敵対的設定においてもO(σK ̄1-∋ce1αT ̄{∋ce{1}{α ̄}))ミニマックス最適レグレットを達成した」を開発したものである.また,著者らは,αとσに関する事前知識を行わなくても,O(σK ̄1-∋ce1αT ̄{∋)ミニマックス最適レグレットを,さらに開発する。この結果は,確率的環境を仮定し,αとσの両方が知られている,既知のレグレット下限(Bubeck et al.,2013)と一致する。著者らが知る限りでは,提案したHTINFalgoアルゴリズムは,最良の2つの世界レグレット保証を楽し,AdaTINFisは,古典的重尾確率的MAB設定と著者らの新しい敵対的定式化において最適ギャップ独立レレット限界を達成するために,αとσの両方に適応できる最初のアルゴリズムである。【JST・京大機械翻訳】