低ランク選好バンディットにおけるより速い学習率を達成するための相関の利用【JST・京大機械翻訳】

Ghoshal Suprovat; Saha Aadirupa

プレプリント

J-GLOBAL ID：202202206798463332 整理番号：22P0294407

低ランク選好バンディットにおけるより速い学習率を達成するための相関の利用【JST・京大機械翻訳】

Exploiting Correlation to Achieve Faster Learning Rates in Low-Rank Preference Bandits

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年02月23日プレプリントサーバーでの情報更新日： 2022年02月23日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ランダム効用ベース選択モデル(RUMs)によるCorelated Prience Bandits問題を導入し,ここでは,オンライン部分集合選好フィードバックを通してnアイテムの与えられたプールから最良のアイテムを同定することを目的とした。単純な相関構造,例えば低ランクを持つモデルが,より速い学習速度をもたらすことができるかどうかを調査した。問題は,一般的低ランク選択モデルを解くのは不可能であるが,より高速な学習速度は,より構造化アイテム相関を仮定して達成できることを示した。特に,著者らは,最良のアイテムがO(rε ̄-2log(n/δ))サンプルだけによって学習可能な(ε,δ)-PACであると示す新しいクラスのBlock-RankベースのRUMモデルを導入した。これは,アイテム相関(r≪n)を利用できない通常の学習アルゴリズムで知られているO(nε ̄-2log(1/δ))の標準サンプル複雑性に結合した。著者らは,上記のサンプル複雑性をマッチング下限(対数因子まで)で補完し,解析の厳しさを正当化した。驚いたことに,学習者がより大きな部分集合のクエリの代わりに,ちょうどバイアルを演ずるとき,Ω(nε-2log(1/δ))の下限を示した。さらに,この方法のロバスト性を確実にするより一般的な「なかったブロックランクモデルに対する結果を拡張した。全体として,著者らの結果は,ペアワイズ選好(k=2)に対する部分集合的クエリーを演ずる利点を正当化し,後者が,相関を活用できないことを示した。【JST・京大機械翻訳】

, , , , ,
, , , , , , 【Automatic Indexing@JST】

人工知能 , ニューロコンピュータ

, ,

前のページに戻る