特許
J-GLOBAL ID:200903068005901579

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平8-049898
公開番号(公開出願番号):特開平9-244687
出願日: 1996年03月07日
公開日(公表日): 1997年09月19日
要約:
【要約】【課題】 環境依存の音素標準パターンを利用した高精度の認識を可能とする。【解決手段】 環境独立の音素を終端記号とする文脈自由文法とLRパーザを利用してネットワークを生成しながら標準パターンを決定すると共に、入力音声とHMMの標準パターンとの照合をとりながらOne-Passサーチによりサーチを進め、HMMの標準パターンに環境依存の音素標準パターンを用い、ネットワークの拡張の際に、先端ノード3からLRパーザにより環境独立の音素P3 が予測されると、新ノード4からその前のノードまで遡り、P1 ,P2 ,P3 の音素列をtriphoneモデルとして環境依存音素標準パターンをノード3-4間の弧に設定する。
請求項(抜粋):
入力音声を特徴パラメータ時系列とし、環境独立の音素を終端記号とする文脈自由文法とLRパーザを利用してネットワークを生成しながら音素標準パターンを決定すると共に、上記入力音声の特徴パラメータ時系列と隠れマルコフモデルの上記標準パターンとの照合をとりながらOne-Passサーチによりサーチを進めて類似尤度の高い候補を認識結果とする音声認識方法において、上記隠れマルコフモデルの標準パターンに環境依存の音素標準パターンを用い、上記ネットワークの拡張の際に、ネットワークの先端から上記環境依存を考慮に入れた音素数だけネットワークを遡ることにより環境依存の音素標準パターンを決定してネットワーク上の弧を設定することを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 531 ,  G10L 3/00 561
FI (3件):
G10L 3/00 535 ,  G10L 3/00 531 D ,  G10L 3/00 561 G

前のページに戻る