特許
J-GLOBAL ID:200903066156239573

音声認識方法及びその装置

発明者:
出願人/特許権者:
代理人 (1件): 大塚 康徳 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-007441
公開番号(公開出願番号):特開平5-197397
出願日: 1992年01月20日
公開日(公表日): 1993年08月06日
要約:
【要約】【目的】 より精度の高い音声認識を実現する。【構成】 マイク1から入力された音声を音声分析部2で分析し、LPCケプストラム係数、デルタケプストラム係数、パワー、デルタパワーなどのパラメータを求める。これらのパラメータに基づいて、CPU4は重み関数ω(t)を求めた後、ROM6に格納されている全ての単語の標準パターンのパラメータとDPマッチングを行って、距離計算を実行する。マッチング終了後、距離が最小となる単語を音声認識結果の最適な単語として選択し、データ出力インタフェース7から出力する。
請求項(抜粋):
入力音声をパラメータ化して参照すべき単語情報との比較を行って音声認識を行う音声認識方法であって、前記入力音声の内、破裂音、鼻音などの動的な特徴を捉えた第1パラメータと前記入力音声の内、母音などの静的な特徴を捉えた第2パラメータとを生成するパラメータ生成工程と、前記入力音声の時間に関するスペクトル変動を考慮して、時間に関して変動する前記第1パラメータ及び第2パラメータに関する重み係数を算出する重み係数算出工程と、前記第1及び第2パラメータと前記重み係数とに基づいて、前記参照すべき単語情報から最適な単語を選択して出力する単語選択工程とを有することを特徴とする音声認識方法。
IPC (2件):
G10L 9/00 301 ,  G10L 3/00 533

前のページに戻る