特許
J-GLOBAL ID:200903025270906972

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 富田 和子
公報種別:公開公報
出願番号(国際出願番号):特願平3-329063
公開番号(公開出願番号):特開平5-165492
出願日: 1991年12月12日
公開日(公表日): 1993年07月02日
要約:
【要約】 (修正有)【構成】認識対象音声の音声入力部102と、入力音声信号を周波数分析し、分析された音声スペクトルに対し推定雑音スペクトルを引き算して、雑音を除去する雑音処理部106と、雑音処理部で得られた音声信号に基づき入力音声の特徴ベクトルを求める分析部108と、騒音環境に応じた雑音重畳音声データを用いて作成した標準パタンを格納しておき、雑音処理部106で除去できなかった残差雑音の雑音情報を求め、雑音情報に基づいて、複数個の標準パタンの中から最適な標準パタンを選択する標準パタン選択部110と、標準パタン選択部により選択された標準パタンと特徴ベクトルとを照合して入力音声を認識する照合部112とを備える。【効果】入力音声にスペクトルサブトラクションによる前処理を施し入力音声のS/Nが改善し、除去しきれなかった雑音に対しても、雑音環境に近い性質の音声データからの標準パタンを用いて照合を行い認識装置の認識率を向上させる。
請求項(抜粋):
認識対象となる音声を入力する音声入力部と、該音声入力部により得られた入力音声信号を周波数分析し、該周波数分析された音声スペクトルに対し推定雑音スペクトルを引き算することにより、雑音を除去する雑音処理部と、該雑音処理部により得られた音声信号に基づき当該入力音声の特徴ベクトルを求める分析部と、予め想定される騒音環境に応じた雑音重畳音声データを用いて作成した複数個の標準パタンを格納しておき、前記雑音処理部から得られた音声信号から雑音処理により除去しきれなかった残差雑音に関する雑音情報を求め、該雑音情報に基づいて前記複数個の標準パタンの中から最適な標準パタンを選択する標準パタン選択部と、該標準パタン選択部により選択された標準パタンと前記特徴ベクトルとを照合して前記入力音声を認識する照合部とを備えたことを特徴とする音声認識装置。
IPC (2件):
G10L 3/00 531 ,  G10L 3/02 301

前のページに戻る