抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ランダム効用ベース選択モデル(RUMs)によるCorelated Prience Bandits問題を導入し,ここでは,オンライン部分集合選好フィードバックを通してnアイテムの与えられたプールから最良のアイテムを同定することを目的とした。単純な相関構造,例えば低ランクを持つモデルが,より速い学習速度をもたらすことができるかどうかを調査した。問題は,一般的 低ランク選択モデルを解くのは不可能であるが,より高速な学習速度は,より構造化アイテム相関を仮定して達成できることを示した。特に,著者らは,最良のアイテムがO(rε ̄-2log(n/δ))サンプルだけによって学習可能な(ε,δ)-PACであると示す新しいクラスのBlock-RankベースのRUMモデルを導入した。これは,アイテム相関(r≪n)を利用できない通常の学習アルゴリズムで知られているO(nε ̄-2log(1/δ))の標準サンプル複雑性に結合した。著者らは,上記のサンプル複雑性をマッチング下限(対数因子まで)で補完し,解析の厳しさを正当化した。驚いたことに,学習者がより大きな部分集合のクエリの代わりに,ちょうどバイアルを演ずるとき,Ω(nε-2log(1/δ))の下限を示した。さらに,この方法のロバスト性を確実にするより一般的な「なかったブロックランクモデルに対する結果を拡張した。全体として,著者らの結果は,ペアワイズ選好(k=2)に対する部分集合的クエリーを演ずる利点を正当化し,後者が,相関を活用できないことを示した。【JST・京大機械翻訳】