特許
J-GLOBAL ID:200903040879515235

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 森本 義弘
公報種別:公開公報
出願番号(国際出願番号):特願平6-302549
公開番号(公開出願番号):特開平8-160987
出願日: 1994年12月07日
公開日(公表日): 1996年06月21日
要約:
【要約】【目的】 少ない処理量でも不正解単語の湧き出しによる誤認識が軽減できる音声認識装置を提供することを目的とする。【構成】 湧き出しによる不正解単語のHMM状態遷移では、ある状態のみが長く継続し、その他の状態では自己遷移を持たない(一回だけで通り過ぎる)という特徴を利用する。この特徴を利用することによって、重み付け処理部15が、HMMの各状態のうち、自己遷移を持たない状態の割合に基づいて各候補の出力確率に重み付けを行い、この重み付けに基づいて、認識結果判定部16が湧き出し候補を排除する。
請求項(抜粋):
登録した単語の音声を認識する音声認識装置において、入力された音声信号を、デジタル値に変換する音声信号入力部と、前記音声信号から変換された前記デジタル値をフレーム分割し、各フレームの音声特徴量を算出する特徴抽出部と、登録済みの単語音声のHMM(ヒドンマルコフモデル)を格納する標準データ格納部と、前記各フレームのフレーム区間における各単語の出力確率を計算する確率計算部と、前記確率計算部により算出される各単語の出力確率に重み付けを行なう重み付け処理部と、認識処理の途中終了および認識結果の判定を行なう認識結果判定部とを備え、前記重み付け処理部を、各単語の確率計算時のHMM状態遷移から自己遷移をもたない状態の割合を求め、その値を用いて各単語の出力確率に重み付けを行なうよう構成した音声認識装置。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 531 ,  G10L 3/00

前のページに戻る