特許
J-GLOBAL ID:200903017709256802

音声認識方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-250537
公開番号(公開出願番号):特開平10-097278
出願日: 1996年09月20日
公開日(公表日): 1998年04月14日
要約:
【要約】【課題】 雑音除去法とHMM合成法を併用することにより高い認識性能で雑音重畳音声を適確かつ高速に認識することができる音声認識方法および装置を提供する。【解決手段】 雑音のない音声データをもとに音声単位のHMMを作成してクリーン音声モデルとして記憶しておき、雑音を減算した雑音重畳音声パワースペクトルから音声特徴パラメータを音響パラメータ抽出部110で抽出し、雑音パワースペクトルから平均雑音パワースペクトルを減算して、消し残りパワースペクトルを算出し、雑音HMMを雑音モデル学習部114で学習し、この学習した雑音HMMをクリーン音声モデルとモデル合成部115で合成して合成モデルを作成し、この合成モデルを用いて音声特徴パラメータに対する各モデルの尤度を計算し、尤度の最も大きなモデルを認識結果として出力する。
請求項(抜粋):
入力音声特徴ベクトル時系列に対して各認識カテゴリの特徴を表現した確率モデルの確率を計算し、最も高い確率を示すモデルが表現するカテゴリを認識結果として出力する音声認識方法において、背景雑音を観測し、観測された雑音に雑音除去法を適用し、消し残った雑音データをもとに確率モデルを作成し、雑音のない音声データをもとに予め作成しておいた音声モデルと前記確率モデルとの合成を行い、雑音が重畳した認識対象の音声に対して雑音除去法を適用し、出力された信号を前記モデル合成で得られたモデルを用いて認識することを特徴とする音声認識方法。
IPC (4件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/02 301
FI (4件):
G10L 3/00 535 ,  G10L 3/00 521 F ,  G10L 3/00 521 L ,  G10L 3/02 301 D
引用特許:
審査官引用 (1件)
  • 音声認識方法
    公報種別:公開公報   出願番号:特願平3-230570   出願人:沖電気工業株式会社

前のページに戻る