抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ニューラルネットワークを含む多くの他のタスクのように,Speech認識モデルは敵対攻撃に対して脆弱である。しかし,最近の研究では,画像モデルと比較してASRモデルに対する攻撃と防御の違いを指摘した。ASRモデルのロバスト性を改善することは,評価における1つまたは2,3のモデルに対する攻撃の評価からのパラダイムシフトを必要とする。ここでは,様々なアーキテクチャ,即ち,目標および非ターゲット,最適化および音声処理ベース,ホワイトボックス,ブラックボックスおよびターゲット攻撃の代表的集合に関する評価により,そのような研究に対して地上を築く。その結果,異なる攻撃アルゴリズムの相対強度はモデルアーキテクチャを変えるとかなり変化し,いくつかの攻撃の結果はブラインドに信頼されないことを示した。それらはまた,自己監督予訓練のような訓練選択が,移動可能な摂動を可能にすることにより,ロバスト性に大きく影響することを示した。このソースコードをパッケージとして放出し,それらの攻撃と防御を評価する将来の研究を助けるべきである。【JST・京大機械翻訳】