特許
J-GLOBAL ID:201303066325794673

雑音/残響除去装置とその方法とプログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2011-172919
公開番号(公開出願番号):特開2013-037174
出願日: 2011年08月08日
公開日(公表日): 2013年02月21日
要約:
【課題】クリーン音声の事例モデルのみを用いて音声強調を行う雑音/残響除去装置を提供する。【解決手段】強調処理結果信頼性計算部は、入力信号の特徴量と、1次音声強調信号とから、その1次音声強調信号の不確かさを示す値を出力する。マッチング部は、1次音声強調信号と、当該1次音声強調信号の不確かさを示す値と、学習データの事例モデルと、を入力として各時間フレームに対して入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントを出力する。音声強調フィルタリング部は、入力信号と学習データセグメントを入力として、該学習データセグメントと対を成す振幅スペクトルデータを事例モデル記憶部から読み出してウィナーフィルタを生成し、入力信号のパワースペクトルにそのウィナーフィルタを乗じてフィルタリングして音声強調信号を出力する【選択図】図1
請求項(抜粋):
雑音・残響の重畳した音声ディジタル信号を入力信号として、該入力信号に1次的な音声強調処理を施した特徴量領域の1次音声強調信号を出力する音声強調処理部と、 上記入力信号の特徴量と、上記1次音声強調信号とから、該1次音声強調信号の不確かさを示す値を出力する強調処理結果信頼性計算部と、 学習データの事例モデルと、その振幅スペクトルデータを記憶する事例モデル記憶部と、 上記1次音声強調信号と該1次音声強調信号の不確かさを示す値と上記学習データの事例モデルとを入力として、各時間フレームに対して上記入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与える学習データセグメントを出力するマッチング部と、 上記入力信号のパワースペクトルと上記学習データセグメントを入力として、該学習データセグメントと対を成す振幅スペクトルデータを上記事例モデル記憶部から読み出してウィナーフィルタを生成し、上記入力信号のパワースペクトルに上記ウィナーフィルタを乗じてフィルタリングして音声強調信号を出力する音声強調フィルタリング部と、 を具備する雑音/残響除去装置。
IPC (3件):
G10L 21/020 ,  G10L 21/023 ,  G10L 15/20
FI (4件):
G10L21/02 102B ,  G10L21/02 101B ,  G10L15/20 380 ,  G10L15/20 370D
Fターム (1件):
5D015EE05
引用文献:
出願人引用 (1件)
  • “A Corpus-Based Approach to Speech Enhancement From Nonstationary Noise,”
審査官引用 (1件)
  • “A Corpus-Based Approach to Speech Enhancement From Nonstationary Noise,”

前のページに戻る