特許
J-GLOBAL ID:200903044052069214

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-170908
公開番号(公開出願番号):特開平5-019786
出願日: 1991年07月11日
公開日(公表日): 1993年01月29日
要約:
【要約】【目的】 1名から数名の少数話者が発声した認識対象音声を用いて不特定話者の音声の認識を可能にし、容易に認識対象音声が変更でき、しかも高い認識率を得ることができる音声認識方法を提供することを目的とする。【構成】 まず認識対象音声を1名または数名の少数話者が発声し、音響分析部1で分析し特徴パラメータを求め、あらかじめ標準パターン格納部3に格納されている多数の話者で作成した汎用の標準パターンとの類似度を分析時間毎に求め、強調関数に通してフレーム毎に正規化を行い、各類似度について時間方向の回帰係数を求めてフレーム毎に正規化し、類似度と回帰係数の時系列をパラメータとして、DP重み計算部10で求めたDPの重みと共に辞書格納部11に登録しておく。認識時には不特定話者の入力音声から辞書登録時と同様にしてパラメータ時系列を求め、辞書格納部に格納されているDP重みにしたがってパターンマッチング部12で辞書とのDPマッチングを行い認識する。
請求項(抜粋):
認識対象音声を1名から数名の少数の話者が発声し、分析時間毎にm個(mは整数)の特徴パラメータを求め、次にあらかじめ多数の話者で作成しておいたn種類(nは整数)の標準パターンとマッチングを行なって分析時間毎にn個の類似度を求めて類似度ベクトルとし、この類似度ベクトルを強調関数に通し分析時間毎に正規化を行い、このn次元の類似度ベクトルで作成した時系列パターンを辞書として登録しておく過程と、入力音声を認識させるときに、入力音声を音響分析し分析時間毎にm個の特徴パラメータを求め、次に前記n種類の標準パターンとマッチングを行ないn次元の類似度ベクトルを求め、辞書登録時と同様の強調関数を通し分析時間毎に正規化を行い、類似度ベクトルの時系列を作成し、辞書に登録されている類似度ベクトルの時系列と動的計画法を用いて照合する過程とを有し、前記照合する過程において、マッチングの重みを分析時間の平均類似度の大きさに応じて変え、平均類似度が低い区間でのマッチングは重みを小さくし、累積類似度への影響を少なくすることにより認識対象音声を登録した話者およびその他の話者の入力音声を認識することを特徴とする音声認識方法。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00

前のページに戻る