Pat
J-GLOBAL ID:200903043630772822

音声認識方法

Inventor:
Applicant, Patent owner:
Agent (1): 小鍜治 明 (外2名)
Gazette classification:公開公報
Application number (International application number):1992004642
Publication number (International publication number):1993188988
Application date: Jan. 14, 1992
Publication date: Jul. 30, 1993
Summary:
【要約】【目的】 本発明は音声認識方法に関するものであり、認識対象辞書項目の変更を容易にし、しかも認識性能を高くすることを目的とする。【構成】 音韻環境を考慮した単語セットを発声した音声を分析して得られる類似度の時系列から切出した音声片パターンが、音声片辞書格納部6に登録されている。認識対象辞書項目項目作成部9において、音声片接続部7で前記音声片パターンを接続して作成した類似度の時系列と、同一の認識対象辞書項目を少数話者が発声した類似度の時系列とを、時間整合部8でDPマッチングによって時間整合を行い、時間的に整合したフレーム間の類似度の平均値を求め、認識対象辞書格納部10に格納する。未知音声を認識する場合は入力音声を同様に分析し、認識対象辞書格納部10に格納されいる各辞書項目とマッチングを行ない、最も類似度の大きい辞書項目を認識結果とする。
Claim (excerpt):
予め音韻環境を考慮した単語セットを発声し、分析時間(フレーム)毎に得られるm個の特徴パラメータと、多数の話者で作成したn種類の標準パターンとのマッチングを行ない、n個の類似度をフレーム毎に求めn次元類似度ベクトルとし、この類似度ベクトルで作成した時系列パターンから音声片を切出して音声片辞書として登録しておき、認識対象語を前記音声片辞書の音声片を接続して作成した類似度ベクトルの時系列パターンと、同一の認識対象語を少数の話者が発声した音声を分析して得られるm個の特徴パラメータと前記n種類の標準パターンとのマッチングを行なって得られるn次元の類似度ベクトルの時系列パターンとの時間整合を行い、時間的に整合したフレーム間で両類似度の平均値を求めその平均値ベクトルの時系列パターンを認識対象辞書に登録し、認識時には入力音声に対して同様に求めたm個の特徴パラメータと、前記n種類の標準パターンとのマッチングを行なってn次元の類似度ベクトルの時系列を求め、この時系列パターンと、認識対象辞書に登録されている類似度ベクトルの時系列パターンとを照合することによって、辞書に登録した話者およびその他の話者の入力音声を認識することを特徴とする音声認識方法。
IPC (3):
G10L 3/00 521 ,  G10L 3/00 531 ,  G10L 5/06
Patent cited by the Patent:
Cited by examiner (5)
  • 特開平1-216397
  • 特開昭59-007998
  • 特開昭61-137199
Show all

Return to Previous Page