特許
J-GLOBAL ID:200903043630772822
音声認識方法
発明者:
,
出願人/特許権者:
代理人 (1件):
小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-004642
公開番号(公開出願番号):特開平5-188988
出願日: 1992年01月14日
公開日(公表日): 1993年07月30日
要約:
【要約】【目的】 本発明は音声認識方法に関するものであり、認識対象辞書項目の変更を容易にし、しかも認識性能を高くすることを目的とする。【構成】 音韻環境を考慮した単語セットを発声した音声を分析して得られる類似度の時系列から切出した音声片パターンが、音声片辞書格納部6に登録されている。認識対象辞書項目項目作成部9において、音声片接続部7で前記音声片パターンを接続して作成した類似度の時系列と、同一の認識対象辞書項目を少数話者が発声した類似度の時系列とを、時間整合部8でDPマッチングによって時間整合を行い、時間的に整合したフレーム間の類似度の平均値を求め、認識対象辞書格納部10に格納する。未知音声を認識する場合は入力音声を同様に分析し、認識対象辞書格納部10に格納されいる各辞書項目とマッチングを行ない、最も類似度の大きい辞書項目を認識結果とする。
請求項(抜粋):
予め音韻環境を考慮した単語セットを発声し、分析時間(フレーム)毎に得られるm個の特徴パラメータと、多数の話者で作成したn種類の標準パターンとのマッチングを行ない、n個の類似度をフレーム毎に求めn次元類似度ベクトルとし、この類似度ベクトルで作成した時系列パターンから音声片を切出して音声片辞書として登録しておき、認識対象語を前記音声片辞書の音声片を接続して作成した類似度ベクトルの時系列パターンと、同一の認識対象語を少数の話者が発声した音声を分析して得られるm個の特徴パラメータと前記n種類の標準パターンとのマッチングを行なって得られるn次元の類似度ベクトルの時系列パターンとの時間整合を行い、時間的に整合したフレーム間で両類似度の平均値を求めその平均値ベクトルの時系列パターンを認識対象辞書に登録し、認識時には入力音声に対して同様に求めたm個の特徴パラメータと、前記n種類の標準パターンとのマッチングを行なってn次元の類似度ベクトルの時系列を求め、この時系列パターンと、認識対象辞書に登録されている類似度ベクトルの時系列パターンとを照合することによって、辞書に登録した話者およびその他の話者の入力音声を認識することを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 521
, G10L 3/00 531
, G10L 5/06
引用特許:
前のページに戻る