特許
J-GLOBAL ID:200903055199821061

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-173990
公開番号(公開出願番号):特開平8-044390
出願日: 1994年07月26日
公開日(公表日): 1996年02月16日
要約:
【要約】【目的】 入力雑音に追従するように周波数領域で環境雑音を推定し、雑音の重畳した音声を入力として認識することができる音声認識装置を提供することを目的とする。【構成】 環境雑音を常時入力・更新し雑音の重畳した音声のスペクトルから雑音のスペクトルを減算した特徴量を求める雑音除去・特徴抽出部32と、標準パタンの特徴量を記憶しておく標準パタン辞書36と、入力の特徴量と標準パタンの特徴量を比較する類似度比較部34と、最終的な認識結果を判定する判定処理部35とを構成し、雑音の周波数特性の時間的変化に追従するように推定雑音を更新することにより雑音の重畳した音声での認識性能の向上が可能となる。
請求項(抜粋):
音声認識において、所定時間間隔のフレーム毎に環境雑音及び入力音声の分析をし、雑音を除去した特徴量の時系列を抽出する雑音除去・特徴抽出部と、あらかじめ発声された単語音声から特徴を抽出した特徴量の時系列を格納した辞書と、入力された特徴量の時系列と辞書の複数の単語の特徴量の時系列を比較し、各単語の類似度を計算する類似度計算部と、各単語の類似度から最も類似した単語を選択する判定処理部とを備え、前記雑音除去・特徴抽出部において、環境雑音を常時入力し、特徴分析する分析部と雑音及び雑音の重畳した音声のスペクトルを時間方向に平滑化するスペクトル平滑化処理部と、入力雑音の雑音スペクトルを記憶する雑音スペクトル記憶部と、入力雑音に追従するように雑音スペクトルを更新する雑音スペクトル更新部を有し、前記平滑化処理部から出力されるスペクトルから前記雑音スペクトル記憶部において入力雑音に追従するように更新されている雑音スペクトルを減算することを特徴とする音声認識装置。

前のページに戻る