強化学習Profit Sharingにおける行動選択に関する一考察

辻和輝; 植村渉

文献

J-GLOBAL ID：201802227508296048 整理番号：18A0138910

強化学習Profit Sharingにおける行動選択に関する一考察

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A0138910&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A0138910&from=J-GLOBAL&jstjournalNo=F0428D") }}

著者 (2件)： ,
資料名：
巻： 2017 ページ： ROMBUNNO.SS13-9 発行年： 2017年11月25日
JST資料番号： F0428D 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

現在の生産現場では,加工作業や搬送作業をロボットが行うFactory Automation化(FA化)が進んでいる。工場での加工用ロボットは教示による制御が一般的である。一方,少量多品種の生産現場においては,変化への柔軟な対応が求められている。そこで,強化学習を導入することで,ロボットの作業を環境に応じて最適化することを目指す。報酬獲得により行動系列を強化する強化学習法では,獲得した報酬値の扱い方として更新型と累積型がある。環境の変化に追随したり,教示データから更新を行ったりするには,更新型の方が望ましい。本研究では,強化学習法であるProfit Sharingに着目し,評価値の更新方法と行動選択方法の関係について調べ,更新型のProfit Sharingの可能性について検討する。(著者抄録)

, , , , , , ,
, ,

人工知能

前のページに戻る