特許
J-GLOBAL ID:200903004653002271

雑音抑圧装置、コンピュータプログラム、及び音声認識システム

発明者:
出願人/特許権者:
代理人 (1件): 清水 敏
公報種別:公開公報
出願番号(国際出願番号):特願2005-356665
公開番号(公開出願番号):特開2007-041499
出願日: 2005年12月09日
公開日(公表日): 2007年02月15日
要約:
【課題】非定常雑音が発生する環境下での音声認識率を改善し、かつ雑音を短時間で抑圧することができる雑音抑圧装置を提供する。【解決手段】雑音抑圧部510は、目的音声と雑音とが重畳した雑音重畳音声を観測することにより得られる観測信号における雑音の成分を抑圧する装置である。雑音抑圧部510は、雑音重畳音声について所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量124を受け、雑音の時間推移に関し拘束条件の設けられた複数のパーティクルを有するパーティクルフィルタとを用いて、雑音を表す確率分布の推定パラメータ206をフレームごとに逐次生成するための雑音確率分布推定部200と、観測信号の特徴量124と、推定パラメータ206と、GMM130とを用いて、フレームごとに目的音声の推定特徴量126を算出するための観測信号分布推定部202及びクリーン音声推定部204とを含む。【選択図】図14
請求項(抜粋):
雑音が発生する環境下での目的音声の観測により得られる観測信号における雑音の成分を抑圧するための雑音抑圧装置であって、 前記観測信号について所定周期ごとにフレーム化された所定時間長のフレームよりそれぞれ抽出される特徴量を受け、前記雑音の時間推移に関し所定の拘束条件の設けられた複数のパーティクルを有するパーティクルフィルタを用いて、前記雑音を表す確率分布の推定パラメータを前記フレームごとに逐次生成するための雑音推定手段と、 前記観測信号の特徴量と、前記推定パラメータと、前記目的音声に関する所定の音響モデルとを用いて、前記フレームごとに前記目的音声の推定特徴量を算出するための目的音声推定手段とを含む、雑音抑圧装置。
IPC (2件):
G10L 15/20 ,  G10L 21/02
FI (4件):
G10L15/20 370Z ,  G10L21/02 102Z ,  G10L21/02 101B ,  G10L21/02 103Z
Fターム (1件):
5D015EE05
引用特許:
出願人引用 (1件)
  • 音声認識システム
    公報種別:公開公報   出願番号:特願2001-070561   出願人:株式会社エイ・ティ・アール音声言語通信研究所
審査官引用 (3件)
引用文献:
前のページに戻る