抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文脈的マルチアームバンドットは,個人化推薦における直接アプリケーションで,意思決定における開発探索ジレンマを解決するための強力なツールを提供する。事実,ユーザ間の協調効果は,推薦を改善する大きなポテンシャルを持つ。本論文では,報酬が非線形関数であり,グループが動的に異なる特定のコンテンツを与えることができる,「Neural Collaborative Filtering Banditsを探索することによって問題を導入し,研究する。この問題を解決するため,メタ学習によりヒントを得て,Meta-Ban(メタバンド)を提案し,そこでは,メタ学習者が,UCBベースの探索戦略と共に,動的グループに表現し,迅速に適応するように設計された。さらに,著者らは,Meta-BanがO(√TlogT)のレグレット結合を達成でき,最先端の関連研究に対して乗法因子√logTを改善することを示した。最後に,著者らは,Meta-Banが6つの強いベースラインよりも著しく優れていることを示す広範な実験を行った。【JST・京大機械翻訳】