Thompsonサンプリングに関するチュートリアル【JST・京大機械翻訳】

Russo Daniel; Van Roy Benjamin; Kazerouni Abbas; Osband Ian; Wen Zheng

プレプリント

J-GLOBAL ID：202202210168993225 整理番号：22P0041323

Thompsonサンプリングに関するチュートリアル【JST・京大機械翻訳】

A Tutorial on Thompson Sampling

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2017年07月07日プレプリントサーバーでの情報更新日： 2020年07月14日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

Thompsonサンプリングは,オンライン決定問題のためのアルゴリズムであり,そこでは,行動が,即時性能を最大化して,将来の性能を改善するかもしれない新しい情報を蓄積するのを投資するのに,行動をバランスしなければならない方法で,連続的に取り込まれる。アルゴリズムは計算的に効率的な方法で広範囲の問題に対処し,従って広い利用を楽しんでいる。このチュートリアルは,アルゴリズムとそのアプリケーションをカバーし,Bernoulliバンド問題,最短経路問題,製品推薦,分類,ニューラルネットワークによる能動学習,およびMarkov決定プロセスにおける強化学習を含む,一連の例を通して概念を例証した。これらの問題のほとんどは,複雑な情報構造を含み,そこでは,他の行動について行動を知らせることにより,情報が明らかにされる。また,Thompsonサンプリングが,また,代替アルゴリズムに対する効果的かつ関係がないか,また,その理由を論じた。【JST・京大機械翻訳】

, , , , , ,
, , , 【Automatic Indexing@JST】

人工知能

前のページに戻る