文献
J-GLOBAL ID:201702271672469728   整理番号:17A1257156

伐採された盗賊フィードバックからの学習のためのリスク回避ツリー【Powered by NICT】

Risk-averse trees for learning from logged bandit feedback
著者 (5件):
資料名:
巻: 2017  号: IJCNN  ページ: 976-983  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
記録されたデータは,記録された情報の最も普及している型の一つである,ほぼ任意のシステムにより得られた低コストで貯蔵できる。慣例上,システム間の相互作用検層とユーザ(あるいは環境)は,コンテキストを逐次決定過程の構造を提示した:与えられれば,系は作用を行い,ユーザがフィードバックを提供する。この構造は実世界ミクロ経済応用,例えば,電子商取引Webサイトと広告キャンペーンの広い範囲に共通していた。将来においてさらに利益性の高い決定を入れて左様な伐採された相互作用からの政策を学習する問題は,記録された盗賊フィードバック(LLBF)問題からの学習として知られている。本論文では,RADT,LLBF設定のための形状特異的回帰木と統計的信頼限界の共同利用を利用したリスク回避学習法に基づくアルゴリズムを提案した。この設定のために開発された既存の技術と異なり,RADTは期待される報酬の下限を最大にする目的で,政策を生成し,殆どのプロセスに影響することとの関連でこれらの特徴の明確な特性化を提供する。最後に,RADTは最新の機械学習分類と回帰法と既存の方法LLBF設定に対処するより優れていることを実験的証拠を示す人工的および実世界データセットの両者の上での広範な実験キャンペーンを提供した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
その他の情報処理  ,  市場調査,広告 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る