文献
J-GLOBAL ID:202002210403154401   整理番号:20A2374158

SirenAttack:エンドツーエンド音響システムのための敵対オーディオの生成【JST・京大機械翻訳】

SirenAttack: Generating Adversarial Audio for End-to-End Acoustic Systems
著者 (6件):
資料名:
号: ASIA CCS ’20  ページ: 357-369  発行年: 2020年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
それらの莫大な人気にもかかわらず,深層学習ベース音響システムは,敵対攻撃に対して本質的に脆弱であり,そこでは,悪意のある芸術音声は,ターゲットシステムを誤動作させる。本論文では,敵対音声を生成する新しいクラスの攻撃であるSirenAtackを提案した。既存の攻撃と比較して,SirenAtackは重要な特徴の集合で強調した。(i)多用途は,ホワイトボックスとブラックボックスの両方の設定の下で,エンドツーエンド音響システムの範囲を減少できる。(ii)有効-itは,ターゲット音響システムによって特定のフレーズとして認識できる敵対的オーディオを生成することができる。および(iii)ステルスは,人間の知覚に対してそれらの良性の対応物と区別できない敵対的オーディオを生成することができる。著者らは,SirenAtackの多用途性,有効性およびステルス性を示す結果を用いて,最先端の深層学習ベース音響システム(音声コマンド認識,話者認識および音事象分類を含む)のセットに関するSirenAtackを経験的に評価した。例えば,それはResNet18モデルに対してIEMOCAPデータセット上で99.45%の攻撃成功率を達成し,一方,生成された敵対音声は,GoogleクラウドSpeech,Microsoft Bing Voice,およびIBM Speech-to-Textを含む多重ポピュラーなASRプラットフォームによって誤って解釈される。さらに,敵対訓練,オーディオダウンサンプリング,および移動平均フィルタリングを含む,そのような攻撃を緩和するための3つの潜在的防御法を評価し,さらなる研究のための有望な方向を導いた。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能  ,  音声処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る