アンサンブル時間周波数マスクとビームフォーミングを組み合わせた音声強調手法の評価

藤田雅彦; 糸山克寿; 糸山克寿; 西田健次; 中臺一博

文献

J-GLOBAL ID：202202243421911243 整理番号：22A2642790

アンサンブル時間周波数マスクとビームフォーミングを組み合わせた音声強調手法の評価

Evaluation of a Speech Enhancement Method Combining Ensemble Time-Frequency Masking and Beamforming

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A2642790&COPY=1") }}
このテーマを更に深掘りする（JDreamⅢへ） {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A2642790&from=J-GLOBAL&jstjournalNo=Y0482A") }}

著者 (5件)： , , , ,
資料名：
巻： 40 号： 7 ページ： 631-634(J-STAGE) 発行年： 2022年
JST資料番号： Y0482A ISSN： 0289-1824 資料種別：逐次刊行物 (A)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

深層学習の進歩により,自動音声認識の認識性能は大きく向上した。一方,環境雑音が厳しい場合には,単語や発話箇所の誤検出が増え,認識精度の劣化の問題が残っている。この問題を解決するため,雑音を抑制し目的の音声のみを強調する手法,すなわち音声強調が数多く提案されている。ほとんどの場合,音声強調では,音源に関するいくつかの仮定を必要とする。さらに,従来の音声強調手法は,単一モデルまたはネットワークを用いて音声を強調するため,入力信号の鍵となる特徴を十分に活かしきれていない。本稿では,アンサンブル時間周波数マスクを用いたビームフォーミングに基づく音声強調手法について報告する。アンサンブル時間周波数マスクは,複数の音声強調手法から複数の時間周波数マスクを推定し,統合することにより生成される。複数の手法から推定された時間周波数マスクを使用することで,処理のロバスト性の向上が期待できる。著者らは,人間の聴感と相関させたPESQとSTOIを用いてCHiME-3 dataset上で提案手法を評価した。両評価指標において,提案手法はアンサンブルなしの手法より優れており,提案手法の有効性を示している。さらに,著者らは,提案手法のアンサンブル手法について検証実験を行った。(翻訳著者抄録)

, , , , , , , ,

著者キーワード (4件)： , , ,

音声処理 , 音響信号処理

引用文献 (19件)：

1) K. Wilson, et al.: “Speech denoising using nonnegative matrix factorization with priors,” IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp.4029-4032, 2008.
2) P. Comon: “Independent component analysis, a new concept?,” Signal Processing, vol.36, no.3, pp.287-314, 1994.
3) K. Shimada, et al.: “Unsupervised beamforming based on multichannel nonnegative matrix factorization for noisy speech recognition,” IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp.5734-5738, 2018.
4) Y. Xu and J. Du: “Dynamic noise aware training for speech enhancement based on deep neural networks,” Interspeech, pp.2670-2674, 2014.
5) B. Veen and K. Buckley: “Beamforming: A versatile approach to spatial filtering,” IEEE ASSP magazine, vol.5, no.2, pp.4-24, 1988.

, , , , , ,

前のページに戻る