転移学習における価値に基づく知識の選別

小谷直樹

文献

J-GLOBAL ID：201502237975456896 整理番号：15A0723062

転移学習における価値に基づく知識の選別

Knowledge Selection based on Value in Transfer Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0723062&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0723062&from=J-GLOBAL&jstjournalNo=L0070A") }}

著者 (1件)：
資料名：
巻： 28 号： 6 ページ： 275-283 発行年： 2015年06月
JST資料番号： L0070A ISSN： 1342-5668 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

強化学習を応用した転移学習では,エージェントがさまざまなタスクを学習することを通して,自ら獲得した知識を蓄積し利用することによって,他の類似したタスクでの学習を効率化できる。多くのタスクを学習し,多くの知識を保持している方が有利と思われるが,一方,知識量が多いということは,計算量の増加や多くのメモリを消費するなど負の影響もある。本研究では,連続状態を扱うマルチタスク下での強化学習問題において,状態価値を用いて有効性の少ない知識を削減する手法を提案した。6リンクの多関節ロボット場合,学習時間が1/9程度に短縮され,タスク達成率は10%以上向上した。

, , , , ,
, ,

ロボットの運動・制御 , 人工知能

引用文献 (16件)：

[1] R. S. Sutton and A. G. Barto(著),三上,皆川(共訳):強化学習, 森北出版 (2000)
[2] M. E. Taylor and P. Stone: Transfer learning for reinforcement learning domains: A survey; Journal of Machine Learning Research, Vol. 10, No. 1, pp. 1633-1685 (2009)
[3] S. Thrun: A lifelong learning perspective for mobile robot control; Proceedings of the IEEE/RSJ/GI Conference on Intelligent Robots and Systems, pp. 23-30 (1994)
[4] 松井,犬塚,世木,伊藤:強化学習結果の再構築への概念学習の適用;人工知能学会論文誌,Vol. 17, No. 2, pp. 135-144 (2002)
[5] L. A. Celiberto Jr., J. P. Matsuura, R. L. de Màntaras and R. A. C. Bianchi: Using transfer learning to speed-up reinforcement learning: a case-based approach; Latin American Robotics Symposium and Intelligent Robotic Meeting (LARS), pp. 55-60 (2010)

, , ,

前のページに戻る