特許
J-GLOBAL ID:200903040144959415
雑音抑圧装置、音声認識システム及び記録媒体
発明者:
,
,
出願人/特許権者:
代理人 (1件):
足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願平11-317206
公開番号(公開出願番号):特開2001-134286
出願日: 1999年11月08日
公開日(公表日): 2001年05月18日
要約:
【要約】【課題】スペクトル領域における音声とノイズの相関の影響を、時間分解能の低下なく抑圧することによって、ノイズ除去における不正確さを低減する。【解決手段】音声は時間と共に変化するものであるため、処理区間が長すぎると時間分解能の低下が生じる。そのため、下段に示すようにフレーム長128点、フレーム周期64点というように、上段の場合の2分の1にしたのである。このようにすると、3フレーム分のスムージングを行っても、フレーム長を半分にする前の1フレーム分の分析長に相当するため、時間分解能の低下が起こらない。しかし、フレーム長及びフレーム周期を半分にしただけで何らの対処もしないと、音声認識装置での認識処理も2倍の頻度で行うこととなり、処理負荷が増大してしまう。そこで、スムージングを2回に1回行うようにした。このようにすれば、音声認識装置での認識処理は従来通りの頻度でよくなる。
請求項(抜粋):
入力信号を、所定の切り出し間隔毎に、所定のフレーム長のフレーム信号として切り出す入力信号切り出し手段と、前記フレーム信号からスペクトラムを算出するスペクトラム算出手段と、前記入力信号に音声が含まれている音声区間と、前記音声が含まれていない雑音区間とを判定する判定手段と、該判定手段によって判定された前記雑音区間の入力信号に基づいて算出した前記スペクトラムを用いて雑音スペクトラムを推定する雑音スペクトラム推定手段と、前記音声区間の入力信号に基づいて算出した前記スペクトラムから、前記雑音スペクトラム推定手段によって推定された前記雑音スペクトラムに所定のサブトラクト係数を乗じたものを引算する引算手段と、該引算手段によって引算された結果に対して時間方向の移動平均処理であるスムージングを実行するスムージング手段とを備える雑音抑圧装置であって、前記入力信号切り出し手段による切り出し間隔は、前記フレーム長のn分の1(nは2以上の整数)であると共に、前記スムージング手段は、前記スムージングをn回に1回実行することを特徴とする雑音抑圧装置。
IPC (5件):
G10L 15/20
, G10L 21/02
, G10L 15/02
, B60R 16/02 655
, G10L101:027
FI (5件):
B60R 16/02 655 A
, G10L101:027
, G10L 3/02 301 D
, G10L 7/08 A
, G10L 9/00 F
Fターム (10件):
5D015CC03
, 5D015CC05
, 5D015EE05
, 5D015FF04
, 9A001BB06
, 9A001GG03
, 9A001HH15
, 9A001HH17
, 9A001JJ73
, 9A001KK37
引用特許:
前のページに戻る