特許
J-GLOBAL ID:200903073614420831

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 前田 弘 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-200031
公開番号(公開出願番号):特開平10-049189
出願日: 1996年07月30日
公開日(公表日): 1998年02月20日
要約:
【要約】【課題】 音声認識装置において、判定可能な認識カテゴリに属さない認識対象外の音声信号の入力を高い確率で却下可能にする。【解決手段】 入力された音声信号の特徴ベクトルから、ファジィベクトル量子化部13によって入力パタンが作成される。マッチング部16は入力パタンと標準パタン記憶部15に記憶されている各標準パタンとのマッチングを行い、パタン間類似度を求める。また、前記特徴ベクトルから標準パタン作成部14によって、標準パタンの作成と同一の手法によって入力標準パタンが作成される。しきい値算出部18は入力パタンと入力標準パタンとのマッチングを行い、しきい値を算出する。認識結果判定部19は、マッチング部16によって求められたパタン間類似度が最大となる標準パタンに対応する認識カテゴリを認識結果として出力するが、パタン間類似度の最大値がしきい値算出部18によって算出されたしきい値を越える場合は入力された音声信号は認識対象外と判定する。
請求項(抜粋):
入力された音声信号に対し、この音声信号が属する認識カテゴリを判定する音声認識装置であって、各認識カテゴリに対応する音声信号の特徴ベクトルから第1の手法によって作成された,各認識カテゴリに対応する標準パタンを記憶する標準パタン記憶部と、入力された認識対象の音声信号の特徴ベクトルから、前記第1の手法と異なる第2の手法によって入力パタンを作成する入力パタン作成部と、前記認識対象の音声信号の特徴ベクトルから、前記第1の手法によって入力標準パタンを作成する標準パタン作成部と、前記入力パタン作成部によって作成された入力パタンと前記標準パタン記憶部に記憶されている各標準パタンとのマッチングを行い、前記入力パタンと前記各標準パタンとの距離を求めるマッチング部と、前記入力パタン作成部によって作成された入力パタンと前記標準パタン作成部によって作成された入力標準パタンとのマッチングを行い、前記入力パタンと前記入力標準パタンとの距離を求め、この距離を基にして当該音声認識装置が判定可能な認識カテゴリに属さない音声信号の入力を却下するためのしきい値を算出するしきい値算出部と、前記マッチング部によって求められた前記入力パタンと前記各標準パタンとの距離及び前記しきい値算出部によって算出されたしきい値を基にして、前記認識対象の音声信号が属する認識カテゴリを判定する認識結果判定部とを備えていることを特徴とする音声認識装置。
IPC (4件):
G10L 3/00 561 ,  G10L 3/00 515 ,  G10L 3/00 521 ,  G10L 5/06
FI (4件):
G10L 3/00 561 B ,  G10L 3/00 515 B ,  G10L 3/00 521 E ,  G10L 5/06 D

前のページに戻る