悪腕存在チェック問題のアルゴリズム

中村篤祥

文献

J-GLOBAL ID：201702210661597756 整理番号：17A0869728

悪腕存在チェック問題のアルゴリズム

Algorithms for Bad Arm Existence Checking Problem

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0869728&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0869728&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (1件)：
資料名：
巻： 117 号： 110(IBISML2017 1-10) ページ： 49-54 発行年： 2017年06月16日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

確率的K腕バンディット問題の設定で,期待報酬が閾値以上のものが存在するか否かをできる限り少ないプレイ回数で判定する悪腕存在チェック問題を考える。これは,K個の検査対象物の内1個でも異常なものがないかを,できるだけ少ない検査回数で判定する問題を定式化したものである。本稿では,まず,与えられたスロットマシン1台に対し,期待報酬が閾値以上であるか否かを判定する腕識別問題を考え,アルゴリズムを与えサンプル複雑度(プレイ回数)の上界を示す。悪腕存在チェック問題に関しては,腕識別問題のアルゴリズムをサブルーチンとして用いる逐次削除アルゴリズムと逐次検査アルゴリズムを示し,各々のサンプル複雑度の上界を示す。(著者抄録)

, , , , , , , ,
, , , ,

人工知能

引用文献 (2件)：

J. Audibert, S. Bubeck, and R. Munos, ”Best arm identification in multi-armed bandits,” The 23rd Conference on Learning Theory, pp.41-53, 2010.
E. Even-Dar, S. Mannor, and Y. Mansour, ”Action elimination and stopping conditions for the multi-armed bandit and reinforcement learning problems,” Journal of Machine Learning Research, vol.7, pp.1079-1105, 2006.

, , ,

前のページに戻る