特許
J-GLOBAL ID:200903064572049772

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-234388
公開番号(公開出願番号):特開平5-088692
出願日: 1991年09月13日
公開日(公表日): 1993年04月09日
要約:
【要約】 (修正有)【目的】 少数話者が発声した音韻環境下の単語セットから音声片を辞書として切出し、作成した認識対象辞書項目を用いて不特定話者の音声の認識に関する。【構成】 多数の話者で作成した音素標準パターンを標準パターン格納部4に格納する。認識対象音声を分析して得られた類似度ベクトルの時系列から切出したパターンを音声片辞書格納部6に登録する。認識対象辞書項目作成部7で音声片パターンを接続して作成し、認識対象辞書格納部8に格納する。未知入力音声を音響分析部1で分析し、特徴パラメータ抽出部2で求めたこのLPCケプストラム係数と標準パターンとのマッチングを類似度計算部3でフレームごとに行ない、パラメータ系列作成部5で求めた類似度ベクトルの時系列と認識対象辞書格納部8に格納されいる各辞書項目の類似度ベクトルの時系列とを認識部9でDPマッチングを行ない類似度の大きい辞書項目を認識する。
請求項(抜粋):
予め、音韻環境を考慮した単語セットを1名から数名の少数の話者が発声し、分析時間(フレーム)毎に得られるm個の特徴パラメータと、多数の話者で作成したn種類の標準パターンとのマッチングを行ないn個の類似度をフレーム毎に求め、この類似度ベクトルで作成した時系列パターンから音声片を切出して音声片辞書として登録しておき、更に前記音声片辞書の音声片を接続して作成した類似度ベクトルの時系列パターンまたは音声片の接続手順を各認識対象項目ごとに作成して認識対象辞書に格納しておき、認識時には入力音声を同様にして分析して得られるm個の特徴パラメータと、前記n種類の標準パターンとのマッチングを行なってn次元の類似度ベクトルの時系列を求め、認識対象辞書の各項目に登録されている類似度ベクトルの時系列パターンまたは音声片の接続手順に従って合成された類似度ベクトルの時系列パターンを照合することによって、辞書に登録した話者およびその他の話者の入力音声を認識することを特徴とする音声認識方法。
IPC (3件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 531
引用特許:
審査官引用 (5件)
  • 特開平1-216397
  • 特開昭59-007998
  • 特開昭61-137199
全件表示

前のページに戻る