ロボット多重ペグインホール組立のためのファジィ論理駆動可変時間スケール予測ベース強化学習【JST・京大機械翻訳】

Hou Zhimin; Li Zhihu; Hsu Chenwei; Zhang Kuangen; Xu Jing

文献

J-GLOBAL ID：202202236780111268 整理番号：22A0397295

ロボット多重ペグインホール組立のためのファジィ論理駆動可変時間スケール予測ベース強化学習【JST・京大機械翻訳】

Fuzzy Logic-Driven Variable Time-Scale Prediction-Based Reinforcement Learning for Robotic Multiple Peg-in-Hole Assembly

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0397295&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0397295&from=J-GLOBAL&jstjournalNo=W1406A") }}

著者 (5件)： , , , ,
資料名：
巻： 19 号： 1 ページ： 218-229 発行年： 2022年
JST資料番号： W1406A ISSN： 1545-5955 CODEN： ITASC7 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習(RL)は,単一peg-in-hole組立にますます使われており,そこでは,集合スキルは,人間が使用するスキルと類似の方法で,組立環境との相互作用を通して学習される。しかしながら,既存のRLアルゴリズムは,はるかに複雑な組立環境が十分な探索を必要とするので,複数のペグインホールアセンブリに適用するのは困難であり,長い訓練時間とより少ないデータ効率をもたらす。この目的のために,本論文では,組立環境を予測する方法,およびRLアルゴリズムのデータ効率を改善するために,組立行動制御における予測環境をどのように使用するかに焦点を当てた。特に,まず,組立環境は,一般的価値関数(GVFs)として定義される可変時間スケール予測(VTSP)によって正確に予測され,不必要な探索を低減する。第2に,著者らは,予測環境が,動作ベースラインとしてファジー論理システム(FLS)によって,提案したインピーダンス動作空間においてインピーダンスパラメータに写像されるRLアルゴリズムの効率を改良するために,組立動作制御のためのファジー論理駆動可変時間スケール予測ベース強化学習(FLDVTSP-RL)を提案した。VTSPの有効性およびFLDVTSP-RL方法のデータ効率を実証するために,二重peg-in-ホール組立実験をセットアップした。結果は,FLDVTSP-深Q-学習(DQN)がDQNと比較して約44%の組立時間を減少させ,FLDVTSP-深い決定論的政策勾配(DDPG)がDDPGと比較して約24%の組立時間を減少させることを示した。実践者は,複数のpeg-in-ホールアセンブリの複雑な組立環境を,力センサから正確に認識できない接触状態をもたらす。したがって,接触状態認識に基づく制御パラメータの調整を必要とする接触モデルベースの方法は,この複雑な環境において直接適用できない。最近,接触状態認識のない強化学習(RL)法が最近科学的興味を引いている。しかし,既存のRL法は,まだ多数の探査と長い訓練時間に依存し,実世界タスクに直接適用できない。本論文は,人間がいくつかの試行で組立スキルを学ぶことができる方法からのインスピレーションを取り上げ,それは環境の可変時間スケール予測(VTSP)と最適化組立行動制御戦略に依存する。提案したファジー論理駆動可変時間スケール予測ベース強化学習(FLDVTSP-RL)を2段階で実装できる。最初に,組立環境を一般的価値関数(GVFs)として定義されるVTSPによって予測した。第2に,ファジィ論理システム(FLS)によって予測環境からマップされたインピーダンスパラメータによって定義されたベースラインを有するインピーダンス動作空間において,組立動作制御を実現した。最後に,二重ペッグインホール組立実験を行った。深いQ学習(DQN)と比較して,FLDVTSP-DQNは約44%の組立時間を減らすことができる。深い決定論的政策勾配(DDPG)と比較して,FLDVTSP-DDPGは,約24%の組立時間を減らすことができる。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

機械の組立 , システム設計・解析 , 工程管理 , 人工知能

, , , , , , ,

前のページに戻る