プレプリント
J-GLOBAL ID:202202215261415110   整理番号:22P0333633

ASRモデルからの目標トレーニングデータの抽出とその軽減法【JST・京大機械翻訳】

Extracting Targeted Training Data from ASR Models, and How to Mitigate It
著者 (5件):
資料名:
発行年: 2022年04月18日  プレプリントサーバーでの情報更新日: 2022年06月27日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
最近の研究では,ASR訓練におけるモデル更新が,更新の計算に用いる発話の潜在的に敏感な属性を漏洩できることを実証する。本研究では,訓練されたASRモデルから訓練データに関する情報漏洩を示す最初の方法を設計した。訓練されたASRモデルから訓練データの目標部分を抽出するためのフィルインザクスタイル方式である雑音Maskingを設計した。最先端のコンフォーマーモデル訓練に用いたLibriSpeechデータセットから名前を抽出するための4つの設定で,雑音Maskingの成功を示した。特に,著者らは,11.8%の精度でマスクされた訓練発話から正しい名前を抽出することができ,一方,モデルは,時間の55.2%の訓練セットからいくつかの名前を出力することを示した。さらに,テストセットから合成オーディオと部分転写物を使用する設定においてさえ,著者らの方法は2.5%の正しい名前精度(47.7%の名目成功率)を達成することを示した。最後に,Word Dropoutをデザインし,マルチスタイルTRaining(MTR)と共に訓練に用いたとき,著者らが示すデータ増強法は,4つの評価した設定を横断して,雑音Maskingによる抽出を著しく緩和するとともに,ベースラインとして同等の有用性を提供する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る