特許
J-GLOBAL ID:200903057682362941

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平5-242764
公開番号(公開出願番号):特開平7-098599
出願日: 1993年09月29日
公開日(公表日): 1995年04月11日
要約:
【要約】【目的】 電話音声のように伝送路の周波数特性による変形を受けた音声信号の認識率を向上させる。【構成】 伝送特性推定モードで、既知の入力音声を分析部2でケプストラム係数、Δケプストラム係数、対数パワーからなる特徴ベクトルの時系列に変換し、この入力音声と同一カテゴリの音声を表わすHMMの標準モデルの系列をモデル記憶部4から取出し、これら入力音声の時系列と、標準モデルの状態とを、補正ケプストラム算出部5で対応づけ、入力音声の時系列のケプストラム係数と、モデルの状態のケプストラム係数との差の平均を求め、補正用ケプストラムとして記憶部6に記憶する。次に未知音声を入力させ、分析部2で同様に特徴ベクトルの時系列に変換し、そのケプストラム係数から記憶部6の補正用ケプストラムを減算して補正し、この補正した特徴ベクトルの時系列を、記憶部4の標準モデルを用いて尤度計算部8で通常の手法で尤度の高い標準モデルの系列を認識結果とする。
請求項(抜粋):
入力音声を音声分析手段によりケプストラム係数を含む特徴ベクトルの時系列に変換し、その時系列と標準モデル記憶部の標準モデルとの尤度を尤度計算手段で計算して、その最大の尤度が得られる標準モデルの音声を認識結果として出力する音声認識装置において、上記音声分析手段により分析された既知入力音声のケプストラム係数と上記標準モデル記憶部内の対応標準モデルのケプストラム係数との差を計算して補正用ケプストラムを作る補正用ケプストラム算出手段と、上記補正用ケプストラムを記憶する補正用ケプストラム記憶部と、上記音声分析手段により分析された未知入力音声の特徴ベクトルに対し、そのケプストラム係数から上記補正用ケプストラムを減算してその補正された特徴ベクトルを上記尤度計算手段へ供給する入力ケプストラム補正手段と、を設けたことを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/02 301

前のページに戻る