抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Thompsonサンプリングは,オンライン決定問題のためのアルゴリズムであり,そこでは,行動が,即時性能を最大化して,将来の性能を改善するかもしれない新しい情報を蓄積するのを投資するのに,行動をバランスしなければならない方法で,連続的に取り込まれる。アルゴリズムは計算的に効率的な方法で広範囲の問題に対処し,従って広い利用を楽しんでいる。このチュートリアルは,アルゴリズムとそのアプリケーションをカバーし,Bernoulliバンド問題,最短経路問題,製品推薦,分類,ニューラルネットワークによる能動学習,およびMarkov決定プロセスにおける強化学習を含む,一連の例を通して概念を例証した。これらの問題のほとんどは,複雑な情報構造を含み,そこでは,他の行動について行動を知らせることにより,情報が明らかにされる。また,Thompsonサンプリングが,また,代替アルゴリズムに対する効果的かつ関係がないか,また,その理由を論じた。【JST・京大機械翻訳】