プレプリント
J-GLOBAL ID:202202216721472253   整理番号:22P0281081

ヘビーテールマルチアームバンディットに対する適応ベストオブボツ世界アルゴリズム【JST・京大機械翻訳】

Adaptive Best-of-Both-Worlds Algorithm for Heavy-Tailed Multi-Armed Bandits
著者 (3件):
資料名:
発行年: 2022年01月27日  プレプリントサーバーでの情報更新日: 2022年06月13日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,重い尾のマルチアームバンドビットの概念を敵対的環境へ一般化し,損失がσ ̄αによって有界のα-th(1<α≦2)モーメントを持つ,一方,分散は存在しなかった,重い尾のマルチアームバンド(MAB)のためのロバスト最良-世界アルゴリズムを開発した。特に,重いテールパラメータαとσがエージェントに知られているとき,アルゴリズムHTINFを設計して,HTINFは,実際の環境タイプアプリオリを知らなくても,確率的および敵対的環境の両方に対して最適レグレットを達成した。α,σが未知である場合,HTINFは確率的事例でlogTスタイルインスタンス依存レグレットを,敵対事例ではo(T)非レギュア保証をachi受する。さらに,アルゴリズムAdaTINFを開発し,αとσに関する事前知識なしに,敵対的設定においてもO(σK ̄1-∋ce1αT ̄{∋ce{1}{α ̄}))ミニマックス最適レグレットを達成した」を開発したものである.また,著者らは,αとσに関する事前知識を行わなくても,O(σK ̄1-∋ce1αT ̄{∋)ミニマックス最適レグレットを,さらに開発する。この結果は,確率的環境を仮定し,αとσの両方が知られている,既知のレグレット下限(Bubeck et al.,2013)と一致する。著者らが知る限りでは,提案したHTINFalgoアルゴリズムは,最良の2つの世界レグレット保証を楽し,AdaTINFisは,古典的重尾確率的MAB設定と著者らの新しい敵対的定式化において最適ギャップ独立レレット限界を達成するために,αとσの両方に適応できる最初のアルゴリズムである。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  通信方式一般  ,  統計学 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る