文献
J-GLOBAL ID:202202269049918773   整理番号:22A0155336

カスケード音声修正モジュールのデータ駆動最適化に基づく軽量で不可逆的な音声擬似化【JST・京大機械翻訳】

Lightweight and irreversible speech pseudonymization based on data-driven optimization of cascaded voice modification modules
著者 (4件):
資料名:
巻: 72  ページ: Null  発行年: 2022年 
JST資料番号: T0677A  ISSN: 0885-2308  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,カスケードと重ね合わせベースの音声修正モジュールを利用する音声偽名化フレームワークを提案した。今日,話し言葉対話システムを使用する機会の増加に伴い,音声データにカプセル化された話者情報のプライバシー保護に関する研究が注目されている。音声プライバシー保護のための1つの方法である偽名化は,話者固有の情報を同時に抑制しながら,音声の明瞭度を保つことを目的とする。このフレームワークの1つの動機は,光計算による信頼できる偽名化性能を達成することである。これを行うために,機械学習ベースと信号処理に基づくアプローチの両方の利点を利用した。利点は,(1)少数のハイパーパラメータでパラメータ化された信号処理ベース手法,(2)自動話者検証と自動音声認識から成るブラックボックスシステムに基づくすべてのハイパーパラメータを最適化するために機械学習ベース最適化を用いることである。データ駆動方式で共同最適化されるカスケード信号処理モジュールは,軽量方式で音声を偽名化する。さらに,著者らは,不可逆偽名化アプローチを議論し,また,元の信号を回復するための適切なパラメータの推定に関して,カスケード法よりもより不可逆的である,他の偽名化法を提案した。VoicePrivacy2020プロトコルの下で行われた実験結果から,筆者らは,(1)著者らのカスケード法が,話者認識率を24%以上悪化させ,同時に,音声認識率を,VoicePrivacy2020の信号処理ベースベースラインシステムと比較して約8%改善し,そして(2)著者らの重合せ法は,偽名化性能に関して,著者らのカスケード法に匹敵することを示した。Copyright 2022 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  パターン認識 

前のページに戻る