特許
J-GLOBAL ID:200903045103525887

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 工藤 宣幸 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-005435
公開番号(公開出願番号):特開平5-188991
出願日: 1992年01月16日
公開日(公表日): 1993年07月30日
要約:
【要約】【目的】 類似単語音声間の識別能力を向上させ得る音声認識装置を提供することである。【構成】 入力音声に対して尤度算出部6は、音韻HMMの連結モデルによって少なくとも一つ以上の候補(i)の列を算出し、当該候補列が予め格納されている近類似単語テーブル8内に記載されているならば、当該候補の、音韻HMMの連結モデルによる最適状態遷移系列をバックトレース部9で求め、ここで特徴時系列を区分化し、特徴の相違部分に相当する識別有効区間を自動的に抽出し、当該候補の識別有効区間の補助特徴を部分類似度算出部10で用いる様にして、総合判定部12で音韻HMMの尤度と補助特徴の部分類似度とから最適単語認識結果情報Iを出力できる様にした。
請求項(抜粋):
入力音声信号に対応して隠れマルコフモデル法を用いて、入力音声信号に対応する複数の候補単語と、その尤度を求めて音声認識を行う音声認識装置において、予め類似単語をグループ化して格納している類似単語格納手段と、予めスペクトル包絡の標準特徴情報を認識可能単語に対応して少なくとも1種類以上格納している標準特徴情報格納手段と、入力音声信号のスペクトル包絡の特徴情報を上記標準特徴情報と同じ種類抽出して、上記特徴情報を系列化して出力する特徴情報系列抽出手段と、上記候補単語とその尤度とから上記類似単語格納手段を検索し、この検索結果に応じてバックトレース処理して最適識別有効区間を抽出する抽出手段とを備えて、上記最適識別有効区間の上記特徴情報系列と、上記標準特徴情報とを用いて、上記尤度を最適に変更して最適単語識別結果を生成出力することを特徴とする音声認識装置。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00

前のページに戻る