観測への敵対的摂動を介した模倣学習による深層強化学習エージェントへの標的型操作攻撃

山辺翔二郎; 福地一斗; 福地一斗; 仙田涼摩; 佐久間淳; 佐久間淳

文献

J-GLOBAL ID：202402235028320275 整理番号：24A1760692

観測への敵対的摂動を介した模倣学習による深層強化学習エージェントへの標的型操作攻撃

Targeted Manipulation Attacks on Reinforcement Learning Agents through Imitation Learning with Perturbed Observations

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
このテーマを更に深掘りする（JDreamⅢへ） {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=24A1760692&from=J-GLOBAL&jstjournalNo=U1701A") }}

著者 (6件)： , , , , ,
資料名：
巻： 38th ページ： ROMBUNNO.2G1-GS-11-03(J-STAGE) 発行年： 2024年
JST資料番号： U1701A ISSN： 2758-7347 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

近年,深層強化学習の発展により自動運転など様々な分野における活用が期待されている.しかし,深層強化学習には敵対的攻撃に対する脆弱性が知られており,実世界への応用のためには強化学習エージェントの頑健性を改善することが求められる.本研究では脆弱性を調査するために実世界の攻撃を想定した標的型操作攻撃手法を提案する.攻撃設定として敵対者は攻撃対象エージェントの観測に介入する.敵対者の目的は攻撃対象エージェントの操作であり,行わせたい振る舞いを軌跡として表現し,それを模倣する様に攻撃する.本研究では攻撃者の目的を模倣学習の問題として扱い,逆強化学習を用いて軌跡を報酬関数に変換したときマルコフ決定過程において通常の方策と同様に学習可能であることを示した.また,逆強化学習の大きな計算コストを抑えるために,模倣学習手法の一つであるGAILが本攻撃設定に適応可能であることを理論的に証明し,攻撃アルゴリズムを示した.最後に,強化学習用ベンチマークMetaWorldにおける実験によって攻撃性能を評価し,設定した脅威モデルのもとで標的型操作攻撃が成功することを示した.(著者抄録)

, , , , , , , , , ,
, , , ,

人工知能 , データ保護

, , , , , , ,

前のページに戻る