特許
J-GLOBAL ID:200903080509319668

パターンマッチングによる単語音声認識方法及びその方法を実施する装置

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平8-048980
公開番号(公開出願番号):特開平9-068994
出願日: 1996年03月06日
公開日(公表日): 1997年03月11日
要約:
【要約】【目的】 入力音声の前後に不要信号区間があった場合、あるいは音声の始端、終端にゆらぎがあった場合の認識率の改善。【構成】 未知の入力音声パターンと複数個の標準パターンとの間のパターンマッチングをとって両者間の距離値の内の最も小さい距離値を有する標準パターンを探索して音声認識する単語音声認識方法において、入力音声パターンの音声区間長と選択した標準パターンの音声区間長との間の差分dが或る一定閾値ε1 を越えると入力音声パターンの複数の異なる位置から部分パターンをそれぞれ抽出して、それらの部分パターンと選択した標準パターンとの間のパターンマッチングを行って得た距離のうち、最小の距離を入力音声パターンに対する選択した標準パターンの距離とする。前記差分dが-ε2≦d≦ε1の場合は、入力音声パターンと標準パターンのそれぞれの両端におけるゆらぎ区間を除去した音声区間でパターンマッチングを行う。
請求項(抜粋):
入力音声パターンと複数個の標準パターンとの間のパターンマッチングをとって両者間の距離値の内の最も小さい距離値を有する標準パターンを探索して音声認識する単語音声認識方法において、以下のステップを含む:(a) 未知の入力ディジタル音声信号をフレーム毎に分析して特徴パラメータを抽出し、(b) 入力ディジタル音声信号の音声区間の始端と終端を検出し、上記音声区間の音声信号の上記特徴パラメータの系列を入力音声パターンとして求め、(c) 標準パターンを選択し、(d) 上記入力音声パターンの区間長と選択した標準パターンの区間長との間の差分dを求め、(e) 上記差分dを予め決めた閾値長ε1 と比較し、ε1 は正の値であり、(e-1) 上記差分が上記閾値長ε1 を越えた場合は上記入力音声パターンから複数の異なる位置で上記選択した標準パターンの区間長とほぼ同じ長さの部分パターンをそれぞれ抽出し、(e-2) 上記部分パターンと上記選択した標準パターンとの間のパターンマッチングを行ってそれら間の距離を求め、(f) 得られた上記距離の中で最小のものを上記音声パターンと上記選択した標準パターンとの間の距離と決定し、(g) 上記ステップ(c)〜(f)をそれぞれの標準パターンについて繰り返して、最小の距離を与える標準パターンのラベルを上記入力ディジタル音声信号に対する認識結果として出力する。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00
FI (2件):
G10L 3/00 531 C ,  G10L 3/00 531 P

前のページに戻る