特許
J-GLOBAL ID:200903082467513399

音声認識方法

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-130440
公開番号(公開出願番号):特開平8-328581
出願日: 1995年05月29日
公開日(公表日): 1996年12月13日
要約:
【要約】【目的】 時間周波数平面上での時間周波数マスキングを音量の変化などに応じて適応的に行なうことにより、音韻知覚に重要な音声スペクトル包絡の音量の大きい周波数帯域であるホルマントを、音声スペクトルが時間的に変化している過渡部分ではその動きを、スペクトルが継続する定常部分ではホルマントそのものを適応的に強調するような音声認識方法を提供する。【構成】 マイクロホン1に入力された音声をスペクトル包絡の時系列に変換し、適応的時間周波数マスキング部9によって、各時点のスペクトル包絡を時間的周波数的に平滑化することにより順向マスキングパターンを求め、その順向マスキングパターンをその時点付近の音量の変化などに応じて適応的に変化させ、その順向マスキングパターンをその時点のスペクトル包絡からマスキングするとともに、その時点のスペクトルの包絡の起伏をする同時マスキングを行なって、学習用音声記憶部11に適応動的ケプストラムを蓄積する。
請求項(抜粋):
入力された音声波形をスペクトル包絡の時系列データに変換し、前記時系列データの各時点について、その時点の直前のみ、または直前および直後の単一または複数個のスペクトルの包絡を時間的周波数的に平滑化することにより順向マスキングパターンを求め、前記順向マスキングパターンをその時点の音量の変化などの過渡的か定常的かを表わす特徴量に応じて変化させるとともに必要に応じてその時点のスペクトル包絡の起伏を鋭くする同時マスキングを行ない、その時点のスペクトルから順向マスキングパターン減算するなどのマスキング操作を行ない、対数スペクトル包絡を逆フーリエ変換して得られたケプストラムに対して上述の操作を行ない、上述の操作を各時点ごとに行なって求めたスペクトルを用いて音声認識を行なうことを特徴とする、音声認識方法。
IPC (3件):
G10L 3/00 535 ,  G10L 7/08 ,  G10L 9/16 301
FI (3件):
G10L 3/00 535 ,  G10L 7/08 B ,  G10L 9/16 301 B

前のページに戻る