特許
J-GLOBAL ID:200903088915994857

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 高田 守 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-049757
公開番号(公開出願番号):特開平8-248983
出願日: 1995年03月09日
公開日(公表日): 1996年09月27日
要約:
【要約】【目的】 音声認識において発声の速度が平均より速い、又は遅い場合にも高い認識率を有する音声認識装置を得る。【構成】 対立候補音声標準モデル生成手段11は、尤度最大基準で決定される認識結果7に対しての対立候補10を記憶している対立候補記憶手段9を参照して、対立候補10の音声標準モデル12を生成し、対立候補照合手段13は、対立候補10の音声標準モデル12から対立候補10の各音素の継続時間長14を求め、再検定手段17は、予め推定し平均継続時間長記憶手段15に記憶した平均継続時間長16と、尤度最大基準で決定される認識結果7の音素の継続時間長データ8と、対立候補10の音素の継続時間長データ14とに基づいて認識結果18を出力する。
請求項(抜粋):
入力音声の音響分析を行なって得られた音声の音響特徴ベクトル時系列に対して、予め用意した音声標準モデルを用いて認識結果を決定する音声認識装置において、前記音響特徴ベクトル時系列を入力し、この入力した前記音響特徴ベクトル時系列に対して尤度が最大である前記音声標準モデルを選択して出力するとともに、この選択した前記音声標準モデルを用いて前記音響特徴ベクトル時系列を音声素片に分解し、この分解した各音声素片の継続時間長を求める照合手段と、前記認識結果に対する対立候補を予め記憶する対立候補記憶手段と、前記照合手段が選択して出力した前記音声標準モデルと前記対立候補記憶手段に記憶された前記対立候補とに基づいて前記対立候補の音声標準モデルを生成する対立候補音声標準モデル生成手段と、この生成した前記対立候補の音声標準モデルと前記音響特徴ベクトル時系列とを入力し、この入力した前記対立候補の音声標準モデルを用いて前記音響特徴ベクトル時系列を音声素片に分解し、この分解した各音声素片の継続時間長を求める対立候補照合手段と、予め推定した音声素片の平均継続時間長を記憶する平均継続時間長記憶手段と、前記照合手段により求めた継続時間長と前記対立候補照合手段により求めた継続時間長と前記平均継続時間長記憶手段に記憶された平均継続時間長とに基づいて前記認識結果を決定する再検定手段とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 535
FI (2件):
G10L 3/00 531 E ,  G10L 3/00 535

前のページに戻る