特許
J-GLOBAL ID:200903085520610589

音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-129132
公開番号(公開出願番号):特開2001-312293
出願日: 2000年04月28日
公開日(公表日): 2001年11月09日
要約:
【要約】【課題】 本発明は音声認識技術に関するものであり、認識性能を落とすことなく少ない計算量で音声の認識を行うことを目的とする。【解決手段】 認識対象語彙セットの音素表記の特徴の似ている音素をマージした音素表記列を認識の最小単位である音声片列に変換しこれを音素マージ音声片ツリーに展開するステップと、前記音素マージ音声片ツリーに従って、あらかじめ求めておいた音声の特徴を表す標準パターンを接続し、これと未知入力音声信号の特徴ベクトル時系列との照合を、ビームサーチを用いたDPマッチングにより時間整合を取りながら行う照合ステップと、結果が一意に決まらなかった場合に、再照合用音声片ツリーに従って標準パターンを接続し、これと未知入力音声との照合を行い認識結果を出力するステップを有するもので、認識性能を落とすことなく少ない計算量で音声の認識を行うことができる。
請求項(抜粋):
未知入力音声信号を音響分析し特徴ベクトル時系列を求めるステップと、認識対象語彙セットの音素表記の特徴の似ている音素をマージした音素表記列を認識の最小単位である音声片列に変換し、これを音素マージ音声片ツリーに展開するステップと、前記音素マージ音声片ツリーに従って、あらかじめ求めておいた音声の特徴を表す音素マージ音声片標準パターンを接続し、これと未知入力音声信号の特徴ベクトル時系列との照合を、ビームサーチを用いたDPマッチングにより時間整合を取りながら行うステップと、照合結果が一意に決まる場合に認識結果を出力するステップと、照合結果が一意に決まらなかった場合に、再照合を行う候補となる認識対象語彙を抽出するステップと、再照合用の音声片ツリーを展開するステップと、再照合用音声片ツリーに従って音声片標準パターンを接続し、これと未知入力音声との照合を、ビームサーチを用いたDPマッチングにより時間整合を取りながら行い認識結果を出力するステップとを有することを特徴とする音声認識方法。
IPC (3件):
G10L 15/12 ,  G10L 15/08 ,  G10L 15/28
FI (3件):
G10L 3/00 533 Z ,  G10L 3/00 561 J ,  G10L 5/06 D
Fターム (4件):
5D015HH04 ,  5D015HH07 ,  5D015HH11 ,  5D015LL02

前のページに戻る