特許
J-GLOBAL ID:200903082100173036

不特定話者モデル作成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-239821
公開番号(公開出願番号):特開平9-081178
出願日: 1995年09月19日
公開日(公表日): 1997年03月28日
要約:
【要約】【課題】 各特定話者モデルのすべてのパラメータが学習されている必要がなく、また話者毎に学習されているパラメータが異なっている場合においても不特定話者モデルを作成できる不特定話者モデル作成装置及び音声認識装置を提供する。【解決手段】 複数の特定話者の発声音声データに基づいて複数の話者に対して同一の初期話者モデルを用いてデータの存在する状態に対してのみ出力ガウス分布を学習することにより、複数個の特定話者用単一ガウス分布のHMMを作成し、各出力ガウス分布間の距離を基準にして、各クラスタにより短い距離に出力ガウス分布が含まれるように複数のクラスタにクラスタリングを行う。次いで、各状態毎にクラスタリングされた単一ガウス分布のHMMに基づいて、各クラスタ内の複数の出力ガウス分布のHMMを各状態の単一ガウス分布のHMMに合成した後混合することにより、不特定話者の混合ガウス分布のHMMを作成する。
請求項(抜粋):
入力された複数の特定話者の単一ガウス分布の隠れマルコフモデルに基づいて、不特定話者の混合ガウス分布の隠れマルコフモデルを作成する不特定話者モデル作成装置において、入力された複数の特定話者の単一ガウス分布の隠れマルコフモデルの各状態の出力ガウス分布を各状態ごとに独立にクラスタリングして合成することにより不特定話者の混合ガウス分布の隠れマルコフモデルを作成するモデル作成手段を備えたことを特徴とする不特定話者モデル作成装置。
IPC (3件):
G10L 3/00 521 ,  G10L 3/00 ,  G10L 3/00 535
FI (3件):
G10L 3/00 521 N ,  G10L 3/00 521 C ,  G10L 3/00 535

前のページに戻る