Pat
J-GLOBAL ID:200903093301890188

音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 高田 守
Gazette classification:公開公報
Application number (International application number):1993077025
Publication number (International publication number):1994289891
Application date: Apr. 02, 1993
Publication date: Oct. 18, 1994
Summary:
【要約】【目的】 非定常雑音が重畳した入力音声に対する認識性能を向上させた音声認識装置を得る。【構成】 雑音重畳入力音声に対し音響分析を施し特徴ベクトル時系列を生成する音響分析手段と、標準音声特徴ベクトルに対し線形予測分析を行い最尤パラメータと標準音声残差パワーを求める線形予測分析手段と、前記最尤パラメータを用いて雑音特徴ベクトルの残差パワーを求める雑音残差演算手段と、同最尤パラメータを用いて雑音重畳入力音声の特徴ベクトルの残差パワーを求める残差パワー演算手段と、雑音重畳入力音声の特徴ベクトルのSN比を求めるSN比演算手段と、このSN比に従い標準音声特徴ベクトルと雑音特徴ベクトルの合成を行う特徴ベクトル合成手段と、この合成された特徴ベクトルと雑音重畳入力音声の特徴ベクトルとの類似度を求める類似度演算手段と、この類似度のデータを用いて雑音重畳入力音声と音声モデルとの照合を行い類似度を最大にする音声モデルのカテゴリを認識結果として出力する照合手段とを備えた。
Claim (excerpt):
相異なる音声を表現する音声モデルを持ち、未知入力音声と前記音声モデルとの照合により音声認識を行う音声認識装置において、雑音が重畳した未知入力音声信号に対し設定される複数個の分析フレームの各々について音響分析を行い雑音重畳入力音声特徴ベクトル時系列を出力する音響分析手段と、音声信号に重畳する雑音の特徴ベクトル時系列を表現する雑音モデルを記憶する雑音モデルメモリと、標準音声の特徴ベクトル時系列を表現する音声モデルを記憶する音声モデルメモリと、音声モデルメモリに記憶されている音声モデルの標準音声特徴ベクトルに対し線形予測分析を行い最尤パラメータと標準音声残差パワーを求める線形予測分析手段と、線形予測分析手段の出力であるところの最尤パラメータを記憶する最尤パラメータメモリと、同じく線形予測分析手段の出力であるところの標準音声残差パワーを記憶する音声残差パワーメモリと、雑音モデルメモリに記憶されている雑音モデルの雑音特徴ベクトルを入力として最尤パラメータメモリ上の最尤パラメータとの積和演算を行い雑音残差パワーを求める雑音残差演算手段と、雑音残差演算手段の出力であるところの雑音残差パワーを記憶する雑音残差パワーメモリと、音響分析手段の出力であるところの雑音重畳入力音声特徴ベクトル時系列の各特徴ベクトルに対し最尤パラメータメモリ上の最尤パラメータとの積和演算を行い雑音重畳入力音声残差パワーを求める残差パワー演算手段と、残差パワー演算手段の出力であるところの雑音重畳入力音声残差パワーと音声残差パワーメモリ上の標準音声残差パワーと雑音残差パワーメモリ上の雑音残差パワーとを用いて雑音重畳入力音声のSN比を求めるSN比演算手段と、SN比演算手段の出力であるところのSN比に従い音声モデルメモリ上の標準音声特徴ベクトルと雑音モデルメモリ上の雑音特徴ベクトルの合成を行い雑音重畳音声特徴ベクトルを生成する特徴ベクトル合成手段と、音響分析手段の出力である雑音重畳入力音声特徴ベクトル時系列の各特徴ベクトルに対し特徴ベクトル合成手段の出力である雑音重畳音声特徴ベクトルとの類似度を演算する類似度演算手段と、類似度演算手段の出力であるところの類似度データを用いて照合処理を行い認識結果を出力する照合手段を備えたことを特徴とする音声認識装置。
IPC (2):
G10L 3/00 521 ,  G10L 3/00 531

Return to Previous Page