特許
J-GLOBAL ID:200903068949097764

不特定話者モデル作成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-257999
公開番号(公開出願番号):特開平8-123468
出願日: 1994年10月24日
公開日(公表日): 1996年05月17日
要約:
【要約】【目的】 学習の話者数を変更したり新たなデータを追加する場合に、最初から学習をやり直す必要が無く、多数の話者を処理することができる不特定話者モデル作成装置及び音声認識装置を提供する。【構成】 入力された複数の特定話者の単一ガウス分布の隠れマルコフモデルを、所定のクラスタリング法により、複数のクラスタにクラスタリングして分類し、分類された複数のクラスタに属する隠れマルコフモデルをそれぞれ、複数のクラスタ毎の単一ガウス分布の隠れマルコフモデルに合成し、合成された各クラスタの単一ガウス分布の隠れマルコフモデルを、所定の話者混合法により混合して、複数の混合分布の隠れマルコフモデルを作成する。作成された隠れマルコフモデルを参照して、入力された発声音声文を音声認識する。
請求項(抜粋):
入力された複数の特定話者の単一ガウス分布の隠れマルコフモデルに基づいて、不特定話者の混合ガウス分布の隠れマルコフモデルを作成する不特定話者モデル作成装置において、入力された複数の特定話者の単一ガウス分布の隠れマルコフモデルを、所定のクラスタリング法により、複数のクラスタにクラスタリングして分類する分類手段と、上記分類手段によって分類された複数のクラスタに属する隠れマルコフモデルをそれぞれ、複数のクラスタ毎の単一ガウス分布の隠れマルコフモデルに合成する合成手段と、上記合成手段によって合成された各クラスタの単一ガウス分布の隠れマルコフモデルを、所定の話者混合法により混合して、複数の混合分布の隠れマルコフモデルを作成する混合手段とを備えたことを特徴とする不特定話者モデル作成装置。
IPC (3件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 535
引用特許:
審査官引用 (2件)
  • 特開昭61-163396
  • 特開平4-125599

前のページに戻る