文献
J-GLOBAL ID:201602218198220178   整理番号:16A0004113

音声存在確率及び統計モデルによって重み付けされたNMFを組み合わせた音声強調

Speech Enhancement Combining NMF Weighted by Speech Presence Probability and Statistical Model
著者 (6件):
資料名:
巻: E98.A  号: 12  ページ: 2701-2704 (J-STAGE)  発行年: 2015年 
JST資料番号: U0466A  ISSN: 1745-1337  資料種別: 逐次刊行物 (A)
記事区分: 短報  発行国: 日本 (JPN)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
従来の非負行列因子分解(NMF)ベース音声強調はきれいな音声及び雑音スペクトル基底の事前知識を用いて反復的に更新する事によって成し遂げられる。あるフレーム中に音声が存在するか否かの確率的推定を用いて,本短報ではNMFプロセスに対する雑音推定を介して得た音声存在確率(SPP)を組み入れた音声強調アルゴリズムを提案した。NMFベース及び統計モデルベースアプローチ双方の利点を取って,SPP重み付けNMFの出力に対して統計モデルベースフィルタを適用する事によって最終強調化音声を達成した。様々な信号対雑音比(SNR)レベルでの20の雑音型を有したTIMIT上の音声品質の知覚評価(PESQ)を用いた客観的評価は従来のNMF及び統計モデルベース基線と比較した提案アルゴリズムの優越性を論証した。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
音声処理  ,  代数学  ,  統計学  ,  確率論 
引用文献 (15件):
  • [1] P.C. Loizou, Speech Enhancement: Theory and Practice, CRC Press, Boca Raton, FL, 2007.
  • [2] J.-H. Choi and J.-H. Chang, “A statistical model-based speech enhancement using acoustic noise classification for robust speech communication,” IEICE Trans. Commun., vol.E95-B, no.7, pp.2513-2516, July 2012.
  • [3] Y. Ephraim and D. Malah, “Speech enhancement using a minimum mean-square error log-spectral amplitude estimator,” IEEE Trans. Acoust., Speech, Signal Process., vol.33, no.2, pp.443-445, April 1985.
  • [4] P.C. Loizou, “Speech enhancement based on perceptually motivated bayesian estimators of the magnitude spectrum,” IEEE Trans. Speech Audio Process., vol.13, no.5, pp.857-869, Sept. 2005.
  • [5] T. Gerkmann and R.C. Hendriks, “Unbiased MMSE-based noise power estimation with low complexity and low tracking delay,” IEEE Trans. Audio Speech Lang. Process., vol.20, no.4, pp.1383-1393, May 2012.
もっと見る

前のページに戻る