特許
J-GLOBAL ID:200903058435845375

雑音抑圧装置、コンピュータプログラム、及び音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2007-139634
公開番号(公開出願番号):特開2008-292858
出願日: 2007年05月25日
公開日(公表日): 2008年12月04日
要約:
【課題】非定常雑音下で、限られた計算資源を用いて雑音を短時間で抑圧する。【解決手段】雑音抑圧装置は、所定周期ごとの観測特徴量を受け、パーティクルフィルタを用いて、雑音を表す確率分布の推定パラメータをフレームごとに生成する雑音推定手段と、推定された雑音の確率分布にしたがって、クリーン音声推定のためのガウス混合モデル(GMM)を適応化する適応化手段と、このGMMと、観測信号の特徴量とを用い、フレームごとに目的音声の推定特徴量をMMSE推定法により算出する目的音声推定手段とを含み、GMMの要素分布はクラスタ162A,164A,166A,...に分類され、目的音声推定手段は、MMSE推定法において必要なGMMのための重みを、複数個のクラスタ162A,164A,166A,...のうち、観測信号の特徴量に対応する点に最も近い代表点304を持つクラスタ164Aに含まれる要素分布のみを用いて算出する。【選択図】 図11
請求項(抜粋):
雑音が発生する環境下での目的音声の観測により得られる観測信号における雑音の成分を抑圧するための雑音抑圧装置であって、 前記観測信号について所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量を受け、複数のパーティクルを有するパーティクルフィルタを用いて、予め準備された、複数個の要素分布からなる、クリーン音声のための音響モデルに基づき、前記雑音を表す確率分布の推定パラメータを前記フレームごとに逐次生成するための雑音推定手段と、 前記雑音推定手段によりパラメータが推定された雑音の確率分布にしたがって、前記音響モデルを雑音に適応化するための手段と、 前記雑音に適応化された前記音響モデルと、観測信号の特徴量とを用いて、前記フレームごとに前記目的音声の推定特徴量をMMSE推定法により算出するための目的音声推定手段とを含み、 前記複数個の要素分布は、予め複数個のクラスタに分類されており、 前記目的音声推定手段は、前記MMSE推定法において、各パーティクルにおける前記雑音に適応化された前記音響モデルのための重みを、前記複数個のクラスタのうち、前記観測信号の特徴量に対応する点に音響空間において最も近い代表点を持つクラスタに含まれる要素分布のみを用いて算出することを特徴とする、雑音抑圧装置。
IPC (1件):
G10L 15/06
FI (1件):
G10L15/06 310T
Fターム (1件):
5D015EE05
引用特許:
出願人引用 (1件) 審査官引用 (4件)
全件表示

前のページに戻る