特許
J-GLOBAL ID:200903078485021080

結合されたストリングモデルの最小誤認率訓練

発明者:
出願人/特許権者:
代理人 (1件): 岡部 正夫 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-169865
公開番号(公開出願番号):特開平7-152394
出願日: 1994年07月22日
公開日(公表日): 1995年06月16日
要約:
【要約】【目的】 本発明は、音声認識などのような音声処理タスクのための音声パラメータベースの訓練に関する。【構成】 音声認識モデルデータベースを作成する方法が開示される。このデータベースは一つの訓練ストリング発声信号と複数のセットの現音声認識モデルに基づいて形成される。これら複数のセットの現音声認識モデルは複数の音響モデル、言語モデル、及び他の認識源(knowledge sources )を含む。本発明の一例としての実現においては、ある一つのセットの複数の混同し易い(confusable)ストリングモデルが生成されるが、各々の混同し易いストリングモデルは二つ或はそれ以上のセットの複数の音声認識モデル(例えば、音響及び言語モデル)からの複数の音声認識モデルから構成される。訓練ストリング発声信号とその発声に対するストリングモデルに基づいて第一のスコアリング信号が生成されるが、ここで、この発声に対するストリングモデルは二つ或はそれ以上のセットの複数の音声認識モデルからの複数の音声認識モデルから構成される。
請求項(抜粋):
訓練ストリング発声信号及び複数のセットの複数の現音声認識モデルに基づいて音声認識モデルデータベースを作成するための方法であって、この方法が:a.セットの一つ或はそれ以上の混同し易いストリングモデルを生成するステップを含み、混同し易いストリングモデルが二つ或はそれ以上のセットの複数の現音声認識モデルからの複数の音声認識モデルから構成され;この方法がさらにb.訓練ストリング発声信号及びその発声に対するストリングモデルに基づいて第一のスコアリング信号を生成するステップを含み、前記のその発声に対するストリングモデルが二つ或はそれ以上のセットの複数の現音声認識モデルからの複数の音声認識モデルから構成され;この方法がさらにc.一つ或はそれ以上の第二のスコアリング信号を生成するステップを含み、第二のスコアリング信号が訓練ストリング発声信号及びある一つの混同し易いストリングモデルに基づき、この混同し易いストリングモデルが二つ或はそれ以上のセットの複数の現音声認識モデルからの複数の音声認識モデルから構成され;この方法がさらにd.第一のスコアリング信号及び一つ或はそれ以上の第二のスコアリング信号に基づいて誤認信号を生成するステップ;及びe.誤認信号に基づいて、正しいストリングモデルが他の複数の混同し易いストリングモデルよりも高いランク順位を持つ確率を増加するために複数の現音声認識モデルを修正するステップを含むことを特徴とする方法。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 521
引用特許:
審査官引用 (1件)
  • 特公平4-026479

前のページに戻る