文献
J-GLOBAL ID:202202243421911243   整理番号:22A2642790

アンサンブル時間周波数マスクとビームフォーミングを組み合わせた音声強調手法の評価

Evaluation of a Speech Enhancement Method Combining Ensemble Time-Frequency Masking and Beamforming
著者 (5件):
資料名:
巻: 40  号:ページ: 631-634(J-STAGE)  発行年: 2022年 
JST資料番号: Y0482A  ISSN: 0289-1824  資料種別: 逐次刊行物 (A)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習の進歩により,自動音声認識の認識性能は大きく向上した。一方,環境雑音が厳しい場合には,単語や発話箇所の誤検出が増え,認識精度の劣化の問題が残っている。この問題を解決するため,雑音を抑制し目的の音声のみを強調する手法,すなわち音声強調が数多く提案されている。ほとんどの場合,音声強調では,音源に関するいくつかの仮定を必要とする。さらに,従来の音声強調手法は,単一モデルまたはネットワークを用いて音声を強調するため,入力信号の鍵となる特徴を十分に活かしきれていない。本稿では,アンサンブル時間周波数マスクを用いたビームフォーミングに基づく音声強調手法について報告する。アンサンブル時間周波数マスクは,複数の音声強調手法から複数の時間周波数マスクを推定し,統合することにより生成される。複数の手法から推定された時間周波数マスクを使用することで,処理のロバスト性の向上が期待できる。著者らは,人間の聴感と相関させたPESQとSTOIを用いてCHiME-3 dataset上で提案手法を評価した。両評価指標において,提案手法はアンサンブルなしの手法より優れており,提案手法の有効性を示している。さらに,著者らは,提案手法のアンサンブル手法について検証実験を行った。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  音響信号処理 
引用文献 (19件):

前のページに戻る