特許
J-GLOBAL ID:200903041611802670

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-331478
公開番号(公開出願番号):特開平7-191689
出願日: 1993年12月27日
公開日(公表日): 1995年07月28日
要約:
【要約】【目的】 認識時の入力音声を用いて、入力音声と標準パタンとの間の付加雑音および回線歪みに関する雑音条件を素早く適合させ、入力の雑音環境に影響されない高性能な音声認識装置を提供する。【構成】 予備マッチング部2から得られた対応付け情報をもとに、スペクトル変換部4から得られた入力音声および標準パタンのスペクトルの時系列をそれぞれ雑音区間、音声区間に分け、各区間毎の平均ベクトルを算出する平均ベクトル算出部5と、雑音区間に対応付けられたスペクトルの時系列の平均ベクトル同士と音声区間に対応付けられたスペクトルの時系列の平均ベクトル同士がそれぞれ一致するような補正を、入力音声のスペクトルの時系列もしくは標準パタンのスペクトルの時系列のどちらか一方または両方に対し行なう補正部6と、最終的なマッチングを行ない認識結果として出力するマッチング部8とを有している。
請求項(抜粋):
入力音声を特徴ベクトルの時系列に変換する分析部と、予め学習用音声を特徴ベクトルの時系列に変換して蓄えられた雑音区間と音声区間とを有する標準パタンと、前記分析部から得られた入力音声の特徴ベクトルの時系列と前記標準パタンの特徴ベクトルの時系列との間の時間軸対応付けを行なう予備マッチング部と、前記入力音声の特徴ベクトルの時系列および前記標準パタンの特徴ベクトル時系列をそれぞれスペクトルの時系列に変換するスペクトル変換部と、前記予備マッチング部から得られた対応付け情報をもとに、前記スペクトル変換部から得られた入力音声および標準パタンのスペクトルの時系列をそれぞれ雑音区間、音声区間に分け、各区間毎の平均ベクトルを算出する平均ベクトル算出部と、前記平均ベクトル算出部が算出した平均ベクトルに関し、雑音区間に対応付けられたスペクトルの時系列の平均ベクトル同士と音声区間に対応付けられたスペクトルの時系列の平均ベクトル同士がそれぞれ一致するような補正を、入力音声のスペクトルの時系列もしくは標準パタンのスペクトルの時系列のどちらか一方または両方に対し行なう補正部と、前記補正部が補正した入力音声および標準パタンのスペクトルの時系列をそれぞれ認識のための特徴ベクトルの時系列に変換する特徴ベクトル変換部と、前記特徴ベクトル変換部から得られた入力音声および標準パタンの認識のための特徴ベクトルを用いて標準パタンと入力音声との間の最終的なマッチングを行ない認識結果として出力するマッチング部とで構成される音声認識装置。
IPC (2件):
G10L 3/00 521 ,  G10L 3/02 301

前のページに戻る