ヘビーテールマルチアームバンディットに対する適応ベストオブボツ世界アルゴリズム【JST・京大機械翻訳】

Huang Jiatai; Dai Yan; Huang Longbo

プレプリント

J-GLOBAL ID：202202216721472253 整理番号：22P0281081

ヘビーテールマルチアームバンディットに対する適応ベストオブボツ世界アルゴリズム【JST・京大機械翻訳】

Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed Bandits

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年01月27日プレプリントサーバーでの情報更新日： 2022年06月13日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本論文では,重い尾のマルチアームバンドビットの概念を敵対的環境へ一般化し,損失がσ ̄αによって有界のα-th(1<α≦2)モーメントを持つ,一方,分散は存在しなかった,重い尾のマルチアームバンド(MAB)のためのロバスト最良-世界アルゴリズムを開発した。特に,重いテールパラメータαとσがエージェントに知られているとき,アルゴリズムHTINFを設計して,HTINFは,実際の環境タイプアプリオリを知らなくても,確率的および敵対的環境の両方に対して最適レグレットを達成した。α,σが未知である場合,HTINFは確率的事例でlogTスタイルインスタンス依存レグレットを,敵対事例ではo(T)非レギュア保証をachi受する。さらに,アルゴリズムAdaTINFを開発し,αとσに関する事前知識なしに,敵対的設定においてもO(σK ̄1-∋ce1αT ̄{∋ce{1}{α ̄}))ミニマックス最適レグレットを達成した」を開発したものである.また,著者らは,αとσに関する事前知識を行わなくても,O(σK ̄1-∋ce1αT ̄{∋)ミニマックス最適レグレットを,さらに開発する。この結果は,確率的環境を仮定し,αとσの両方が知られている,既知のレグレット下限(Bubeck et al.,2013)と一致する。著者らが知る限りでは,提案したHTINFalgoアルゴリズムは,最良の2つの世界レグレット保証を楽し,AdaTINFisは,古典的重尾確率的MAB設定と著者らの新しい敵対的定式化において最適ギャップ独立レレット限界を達成するために,αとσの両方に適応できる最初のアルゴリズムである。【JST・京大機械翻訳】

, , , , , ,
, , 【Automatic Indexing@JST】

人工知能 , 通信方式一般 , 統計学

, ,

前のページに戻る