ASRモデルからの目標トレーニングデータの抽出とその軽減法【JST・京大機械翻訳】

Amid Ehsan; Thakkar Om; Narayanan Arun; Mathews Rajiv; Beaufays Francoise

プレプリント

J-GLOBAL ID：202202215261415110 整理番号：22P0333633

ASRモデルからの目標トレーニングデータの抽出とその軽減法【JST・京大機械翻訳】

Extracting Targeted Training Data from ASR Models, and How to Mitigate It

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年04月18日プレプリントサーバーでの情報更新日： 2022年06月27日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

最近の研究では,ASR訓練におけるモデル更新が,更新の計算に用いる発話の潜在的に敏感な属性を漏洩できることを実証する。本研究では,訓練されたASRモデルから訓練データに関する情報漏洩を示す最初の方法を設計した。訓練されたASRモデルから訓練データの目標部分を抽出するためのフィルインザクスタイル方式である雑音Maskingを設計した。最先端のコンフォーマーモデル訓練に用いたLibriSpeechデータセットから名前を抽出するための4つの設定で,雑音Maskingの成功を示した。特に,著者らは,11.8%の精度でマスクされた訓練発話から正しい名前を抽出することができ,一方,モデルは,時間の55.2%の訓練セットからいくつかの名前を出力することを示した。さらに,テストセットから合成オーディオと部分転写物を使用する設定においてさえ,著者らの方法は2.5%の正しい名前精度(47.7%の名目成功率)を達成することを示した。最後に,Word Dropoutをデザインし,マルチスタイルTRaining(MTR)と共に訓練に用いたとき,著者らが示すデータ増強法は,4つの評価した設定を横断して,雑音Maskingによる抽出を著しく緩和するとともに,ベースラインとして同等の有用性を提供する。【JST・京大機械翻訳】

, , , , , ,
, , , , 【Automatic Indexing@JST】

パターン認識

, , ,

前のページに戻る