音声モデルの構成方法及び音声認識装置

発明者： ,
出願人/特許権者：
代理人 (1件)：頓宮孝一 (外4名)
公報種別：公開公報
出願番号（国際出願番号）：特願平4-259301
公開番号（公開出願番号）：特開平6-110493
出願日： 1992年09月29日
公開日（公表日）： 1994年04月22日
要約：

【要約】 (修正有)【目的】種々の発声変形を少ない種類のHMMの統計的組み合わせにより効率よく表現した音声認識装置を実現する。【構成】入力語を特徴抽出装置4で特徴解析し、対応する特徴ベクトル列、またはラベル付け装置8でラベル列を得る。サブワードの音声として音声変形候補毎に、フェノニック型ヒドウン・マルコフ・モデルを語中の先行のサブワードの音声変形候補とのNグラム関係(Nは2以上の整数)を与えパラメータ・テーブル18に保持する。認識装置16によって、認識対象単語発音辞書13の記述候補語に対応し、Nグラム関係に基づいて音声変形候補毎にHMMをあてはめ、音声変形候補毎の各HMMをサブワード間で並列に連結させ音声モデルを構成し、各候補語について構成音声モデルが音声入力された語のラベル列または特徴ベクトル列を出力する確率を求め、最も高い確率の音声モデルに対応する候補語を認識結果として表示装置19へ出力する。

請求項（抜粋）：

音声として入力された語のラベル列または特徴ベクトル列を出力する尤度の高い音声モデルを特定することにより、当該語を認識する音声認識に用いる音声モデルにおいて、語を構成するサブワードが音声として変形した音声変形候補毎に、ヒドウン・マルコフ・モデルを語中で先行する他のサブワードの音声変形候補とのNグラム関係(Nは2以上の整数)を与えて保持し、音声認識を行う際に、認識対象の語に対応し、且つ、前記Nグラム関係に基づいて音声変形候補の各ヒドウン・マルコフ・モデルをサブワード間で並列に連結させて音声モデルを構成することを特徴とする音声モデルの構成方法。

IPC (2件)：

G10L 3/00 535 , G10L 3/00 521

前のページに戻る