特許
J-GLOBAL ID:200903014936366810

音響モデル生成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-245206
公開番号(公開出願番号):特開平11-085187
出願日: 1997年09月10日
公開日(公表日): 1999年03月30日
要約:
【要約】【課題】 音声データの特性をより精密に反映することができるとともに、不特定話者音響モデルの表現力を従来例に比較して向上させることができ、しかもより高い音声認識率で音声認識することができる音響モデルを生成するための音響モデル生成装置、及び音声認識装置を提供する。【解決手段】 初期HMM生成部21は、音声データの特徴パラメータに基づいて、所定の学習アルゴリズムにより初期のHMMを生成し、HMM再構成部22は、音声データに対して初期のHMMが起こすフレーム単位の識別誤りであるフレーム誤りの傾向に基づいてHMMのガウス混合分布のコンポーネントを追加することにより初期のHMMを再構成して再構成されたHMMを生成し、再学習部23は音声データの特徴パラメータに基づいて、所定の学習アルゴリズムにより再構成されたHMMを再学習することにより、再学習されたHMMである音響モデルを生成する。
請求項(抜粋):
所定の音声データの特徴パラメータに基づいて、所定の学習アルゴリズムにより、初期の隠れマルコフモデルを生成する第1の生成手段と、上記音声データに対して初期の隠れマルコフモデルが起こす、所定の時間のフレーム単位の識別誤りであるフレーム誤りの傾向に基づいて隠れマルコフモデルのガウス混合分布のコンポーネントを追加することにより、上記第1の生成手段によって生成された初期の隠れマルコフモデルを再構成して、再構成された隠れマルコフモデルを生成する第2の生成手段と、上記音声データの特徴パラメータに基づいて、所定の学習アルゴリズムにより、上記第2の生成手段によって生成された隠れマルコフモデルを再学習することにより、再学習された隠れマルコフモデルである音響モデルを生成する第3の生成手段とを備えたことを特徴とする音響モデル生成装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 521
FI (2件):
G10L 3/00 535 ,  G10L 3/00 521 F

前のページに戻る