文献
J-GLOBAL ID:202002260023349617   整理番号:20A1111923

近最適リグレット上限を用いた自己加速Thompsonサンプリング【JST・京大機械翻訳】

Self-accelerated Thompson sampling with near-optimal regret upper bound
著者 (3件):
資料名:
巻: 399  ページ: 37-47  発行年: 2020年 
JST資料番号: W0360A  ISSN: 0925-2312  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Thompsonサンプリングは,探索-開発トレードオフをバランスさせるためにBayes発見的戦略を利用する。それは種々の実用的領域に適用され,大きな成功を達成した。経験的に効率的で強力なにもかかわらず,Thompsonサンプリングは理論的解析を行った。Thompsonサンプリングの既存の解析により,線形文脈帯域に対してO(d3/2T)のレレット上限を与えるだけであり,これはdの因子による情報理論的下限よりも悪い。本論文において,著者らは確率的文脈のマルチアーム化されたバンディット問題のために自己加速されたThompsonサンプリングアルゴリズムを設計して解析した。著者らの解析は,自己加速Thompsonサンプリングのレグレット上限がO(dT)であることを確立して,それは無限作用空間における任意の効率的文脈的なbanditアルゴリズムによって達成される最良の上限であった。シミュレーションデータと実世界データセットに関する著者らの実験は,自己加速Thompsonサンプリングが収束速度と予測精度の両方において標準的なThompsonサンプリングより優れていることを示した。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る