特許
J-GLOBAL ID:200903099381039570

音声認識方式

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平4-185452
公開番号(公開出願番号):特開平6-035496
出願日: 1992年07月13日
公開日(公表日): 1994年02月10日
要約:
【要約】【目的】入力された音声から認識対象とする音声を正確に抽出し、かつ計算量が少なく高速に認識することができるようにする。【構成】入力音声を音響分析部1により例えばLPC分析して特徴パラメータを求め、その特徴パラメータから、音声量子化部3により、量子化された音声セグメント系列などのラベル系列を求め、このラベル系列をカテゴリ毎のHMMを用いてHMM認識部5にて認識する。この認識処理の都度、入力ラベル系列に対してHMMの状態が遷移したフレームを状態遷移位置検出部7にて検出し、このフレームを基準として、次にHMM認識部5で用いる始端フレームを始端フレーム算出部8で求め、このフレームが認識終了判定部9での認識終了判定条件に合致していなければ、このフレームを始端とするラベル系列をHMMへ入力してHMM認識部5にて再度認識する構成とする。
請求項(抜粋):
入力される音声信号を音響分析することにより特徴パラメータを求める音響分析手段と、この音響分析手段により求められた特徴パラメータからフレーム毎にラベルを求める音声量子化手段と、この音声量子化手段により求められたラベルの系列をカテゴリ毎に用意されたHMM(Hidden Markov Model )を用いて認識する認識手段と、この認識手段による認識処理の都度、前記HMMに入力されたラベル系列に対して前記HMMの状態が遷移したフレームを求める状態遷移位置検出手段と、この状態遷移位置検出手段により求められた状態遷移フレームの位置を基準として、次の認識処理で前記HMMへ入力するラベル系列の始端となるフレームを求める始端フレーム算出手段と、を具備し、前記始端フレーム算出手段により求められたフレームを始端とするラベル系列を前記HMMへ入力して前記認識手段における次の認識処理を行うようにしたことを特徴とする音声認識方式。

前のページに戻る