Pat
J-GLOBAL ID:200903063821468873
音声認識方法
Inventor:
,
Applicant, Patent owner:
Agent (1):
小鍜治 明 (外2名)
Gazette classification:公開公報
Application number (International application number):1991234386
Publication number (International publication number):1993073087
Application date: Sep. 13, 1991
Publication date: Mar. 26, 1993
Summary:
【要約】【目的】 汎用の音素標準パタ-ンに対する類似度を特徴パラメータとする音声認識方法で、無声化や音便化に対しても高い認識率を得ることを目的とする。【構成】 認識部11で認識対象辞書格納部10の辞書パターンとDPマッチングを行ない最も類似度の大きい辞書項目を認識結果とする。このとき、母音の無声化や連続母音の音便化のような発声変形が起こり得る辞書について、少数話者の発声による実際に発声変形が起こったパターンと起こらなかったパターンから切出した音声片を接続してその部分のみ認識対象辞書をマルチパターンとして認識対象辞書文字列格納部8に持ち、認識時には入力音声との類似度の大きくなるどちらか一方のパターンを選択して類似度を求めて認識する。
Claim (excerpt):
予め、音韻環境を考慮した単語セットを1名から数名の少数の話者が発声し、分析時間(フレーム)毎にm個の特徴パラメータを求め多数の話者で作成したn種類の標準パターンとのマッチングを行ないn個の類似度とn個の類似度の時間変化量をフレーム毎に求め、この類似度ベクトルと類似度の時間変化量ベクトルで作成した時系列パターンから音声片を切出して音声片辞書として登録しておき、更に前記音声片辞書の音声片を接続して作成した類似度ベクトルと類似度の時間変化量ベクトルの時系列パターンまたは音声片の接続手順を各認識対象項目ごとに作成して認識対象辞書に格納しておき、認識時には、入力音声を同様にして分析して得られるm個の特徴パラメータと、前記n種類の標準パターンとマッチングを行ないn次元の類似度ベクトルとn次元の類似度の時間変化量ベクトルの時系列を求め、認識対象辞書の各項目に登録されている類似度ベクトルと類似度の時間変化量ベクトルの時系列パターンまたは音声片の接続手順にしたがって合成された類似度ベクトルと類似度の時間変化量ベクトルの時系列パターンを照合することによって、辞書に登録した話者およびその他の話者の入力音声を認識すると共に、母音の無声化や連続母音の音便化のような発声変形が起こり得る辞書について、少数話者の発声による実際に発声変形が起こったパターンと起こらなかったパターンから切出した音声片を接続してその部分のみ認識対象辞書をマルチパターンとして持ち、認識時には入力音声との類似度の大きくなるどちらか一方のパターンを選択して類似度を求めて認識することを特徴とする音声認識方法。
IPC (2):
G10L 3/00 521
, G10L 3/00
Return to Previous Page