プレプリント
J-GLOBAL ID:202202217063026950   整理番号:22P0288929

埋込みによる大規模アクション空間のためのオフポリシー評価【JST・京大機械翻訳】

Off-Policy Evaluation for Large Action Spaces via Embeddings
著者 (2件):
資料名:
発行年: 2022年02月13日  プレプリントサーバーでの情報更新日: 2022年06月15日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
文脈的帯域におけるオフポリシー評価(OPE)は,歴史的ログデータのみを用いて新しい政策のオフライン評価を可能にするので,実世界システムにおいて急速な採用が見られる。残念なことに,行動の数が大きいとき,既存のOPE推定器は,逆傾向スコア重みづけに基づくものが最も大きく,極端なバイアスと分散を被る。これは,推薦システムから言語モデルへの多くの応用におけるOPEの使用をフォイルする。この課題を克服するために,行動埋め込みが行動空間で構造を提供するとき,限界化重要度重みを利用する新しいOPE推定器を提案する。提案した推定子のバイアス,分散,および平均二乗誤差を特性化し,動作埋込みが従来の推定器よりも統計的利点を提供する条件を解析した。理論解析に加えて,著者らは,経験的性能改善が実質的であり,既存の推定器が多数の動作により崩壊する場合でも,信頼できるOPEを可能にすることを見出した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  放射,大気光学 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る