特許
J-GLOBAL ID:200903034274121375

音声認識システムにおける隠れマルコフ音声モデルの適合方法

発明者:
出願人/特許権者:
代理人 (1件): 矢野 敏雄 (外3名)
公報種別:公表公報
出願番号(国際出願番号):特願平10-513150
公開番号(公開出願番号):特表2001-503154
出願日: 1997年09月10日
公開日(公表日): 2001年03月06日
要約:
【要約】本発明によれば一般的な音声認識装置で使用されるコードブック(CB)がアプリケーション専用の場合に隠れマルコフ音声モデルにより適合化される。この場合ユーザによって変更された辞書(LEX)によりアプリケーションが規定される。適合化(ADAP)は動作中、隠れマルコフモデルの確率密度分布の記憶された平均値ベクトルをシフトすることにより、音声表示の既知の特徴ベクトルの方向で、かつ専用で使用される隠れマルコフモデルに対して行われる。従来の方法に比べて本発明はオンラインで実施することができ、またきわめて高い識別速度がわずかな計算コストで保証される利点を有する。さらに相応のアプリケーションに専用の音声モデルをトレーニングするコストが必要なくなる。多言語での音素から専用の隠れマルコフモデルを用いて種々の言語にわたる音声の類似を利用することにより、外国語への自動的な適合が可能となる。ここで使用される音響的音素的モデリング方法では、種々の言語での種々の隠れマルコフ音声モデルの確率密度を統合する際に言語特有の特性も言語に依存しない特性も考慮することができる。
請求項(抜粋):
音声認識装置のコードブック内の隠れマルコフ音声モデルを使用される音声辞書の語彙変化にリアルタイムで適合させる方法において、 a)認識すべき隠れマルコフ音声モデルを確率分布の少なくとも1つの第1の平均値ベクトルによりコードブック(CB)内で任意に保持し、 b)通常の手段で特徴ベクトルを音声信号(SPRA)から抽出し、また特徴ベクトルを隠れマルコフ音声モデルの確率分布に割り当てることにより、音声認識(ERKE)をコードブック(CB)から行い、 c)語彙変化の少なくとも1つの既知の音声表示(WO)に対して該音声表示が認識された直後に、少なくとも1つの所属の隠れマルコフ音声モデルの第1の重心ベクトルの位置を、定められた適応係数により対応する特徴ベクトルの位置に一定に適合させ(ADAP、CB、100)、適合された平均値ベクトルをコードブック(CB)内で第1の平均値ベクトルとして格納する、 ことを特徴とする隠れマルコフ音声モデルを使用される音声辞書の語彙変化にリアルタイムで適合させる方法。
IPC (2件):
G10L 15/06 ,  G10L 15/14
FI (2件):
G10L 3/00 521 G ,  G10L 3/00 535 Z

前のページに戻る