特許
J-GLOBAL ID:200903069799395970

音声認識装置、音声認識方式及び音声認識プログラム

発明者:
出願人/特許権者:
代理人 (1件): 外川 英明
公報種別:公開公報
出願番号(国際出願番号):特願2001-376615
公開番号(公開出願番号):特開2003-177783
出願日: 2001年12月11日
公開日(公表日): 2003年06月27日
要約:
【要約】【課題】入力音声の乗算性ノイズによる変動を補正する音声認識装置において、乗算性ノイズの推定の精度によらず、不特定話者および不特定環境における良好な認識性能を提供する。【解決手段】補正前の特徴ベクトル時系列に対する補正前音声標準パターンの尤度と補正後の特徴ベクトル時系列に対する補正後音声標準パターンの尤度とをそれぞれ求め、これら補正前音声標準パターンの尤度と補正後音声標準パターンの尤度とを合成した尤度に基づく音声認識処理を行う。
請求項(抜粋):
入力された音声信号をフレーム毎に切り出して特徴ベクトル時系列に変換する音声分析部と、この音声分析部から出力された前記特徴ベクトル時系列の任意の区間内での平均値を求める平均値導出部と、この平均値導出部で求められた前記平均値を記憶する平均値記憶部と、この平均値記憶部で記憶された前記平均値を前記特徴ベクトル時系列からフレーム毎に減算することで前記特徴ベクトル時系列を補正する補正部と、前記音声分析部から出力された補正前の特徴ベクトル時系列を用いて補正前音声標準パターンに対する尤度を計算する補正前尤度計算部と、前記補正部から出力された補正後の特徴ベクトル時系列を用いて補正後音声標準パターンに対する尤度を計算する補正後尤度計算部と、前記補正前尤度計算部から出力される尤度と前記補正後尤度計算部から出力される尤度とを合成する尤度合成部と、この尤度合成部から出力される尤度に基づいて音声認識を行う認識処理部とを備える音声認識装置。
IPC (4件):
G10L 15/10 ,  G10L 15/02 ,  G10L 15/20 ,  G10L 21/02
FI (3件):
G10L 3/00 531 G ,  G10L 9/16 301 A ,  G10L 3/02 301 D
Fターム (7件):
5D015AA02 ,  5D015CC11 ,  5D015EE01 ,  5D015EE05 ,  5D015FF04 ,  5D015HH05 ,  5D015HH06
引用特許:
審査官引用 (1件)
  • 音声認識装置
    公報種別:公開公報   出願番号:特願平8-069926   出願人:三菱電機株式会社

前のページに戻る