特許
J-GLOBAL ID:200903052316150816

個別話者に適応した音声認識のための方法及び装置

発明者:
出願人/特許権者:
代理人 (1件): 川原田 一穂
公報種別:公表公報
出願番号(国際出願番号):特願平8-522406
公開番号(公開出願番号):特表平10-512686
出願日: 1996年01月19日
公開日(公表日): 1998年12月02日
要約:
【要約】音声の自動認識のための方法及び装置は、適応データを用いて変換することにより特定の話者に適応する。この変換により、話者独立モデルが話者適応モデルに変換される。話者適応モデルは話者の認識のために用いられ、非適応モデルよりも優れた認識精度を達成する。別の実施例では、変換に基づいた適応技術が既知のベイズの適応技術と結合される。
請求項(抜粋):
話者から音声信号を受けるための手段、 前記音声信号を特徴ベクトルのデータセットに変換するための特徴抽出手段、 複数の話者独立モデルを記憶するための手段であって、前記モデルは初期には未定パラメータを有する前記記憶手段、 1組の訓練データから前記話者独立モデルのパラメータを求めるための訓練エンジン、 特定話者から音声データを受けることができ、最尤技術を用い且つ1組の話者適応モデルを発生して、前記話者独立モデルのパラメータを変換するための適応エンジン、及び 前記話者独立モデル及び前記話者適応モデルを用いて、1組の未確認特徴ベクトルから単語を認識できる認識エンジンから成る話者適応音声認識システム。
IPC (2件):
G10L 3/00 531 ,  G10L 3/00 535
FI (2件):
G10L 3/00 531 K ,  G10L 3/00 535
引用特許:
審査官引用 (2件)
  • 特公平7-001435
  • 特開平3-206500

前のページに戻る