特許
J-GLOBAL ID:200903056263398514

雑音レベル推定方法、音声区間検出方法、音声認識方法、音声区間検出装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 吉田 研二 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-096876
公開番号(公開出願番号):特開平10-288994
出願日: 1997年04月15日
公開日(公表日): 1998年10月27日
要約:
【要約】【課題】 非定常雑音、雑音レベルの変動、付帯雑音、応答音声等の影響を低減・克服する。【解決手段】 入力される信号を音声分析部4によって分析し、そのパワーレベル及び特徴量ベクトルを抽出する。抽出されたパワーレベルに基づき頻度情報更新部9が頻度情報記憶部13上にパワー分布図を作成する。雑音レベル判定部10は、このパワー分布図から最大頻度を検出し、最大頻度の上下所定区間内にありかつ最大頻度に対して所定比率以上の頻度を有する階級を選択し、選択した階級に係るパワーの平均値にて閾値設定部11が閾値を設定する。始端・終端検出部12が、設定された閾値を用いて音声区間を切り出し、認識部7が、音声分析部4により抽出された特徴量ベクトルを用い、切り出された音声区間について音声認識を行う。応答音声出力部2からの応答音声をエコーキャンセル部3が入力信号からキャンセルし、漏れ込み量判定部5が応答音声の漏れ込み量を判定して閾値に制限を施す。
請求項(抜粋):
入力信号からそのパワー分布を作成する分布作成ステップと、上記パワー分布にて最大頻度を呈する階級である最大頻度パワーを検出する最大頻度検出ステップと、上記最大頻度パワーに応じて選んだ複数の階級を上記パワー分布から部分分布として取り出す部分分布抽出ステップと、上記部分分布に基づき上記入力信号における雑音レベルを推定する雑音レベル推定ステップとを有することを特徴とする雑音レベル推定方法。
IPC (2件):
G10L 3/00 513 ,  G10L 3/02 301
FI (2件):
G10L 3/00 513 A ,  G10L 3/02 301 A
引用特許:
出願人引用 (2件)
  • 特開平4-147083
  • 特開昭59-219797
審査官引用 (9件)
  • 特開平4-147083
  • 特開昭59-219797
  • 特開平3-015897
全件表示

前のページに戻る