Pat
J-GLOBAL ID:200903077908290036

音声モデルの構成方法及び音声認識装置

Inventor:
Applicant, Patent owner:
Agent (1): 頓宮 孝一 (外4名)
Gazette classification:公開公報
Application number (International application number):1992259301
Publication number (International publication number):1994110493
Application date: Sep. 29, 1992
Publication date: Apr. 22, 1994
Summary:
【要約】 (修正有)【目的】種々の発声変形を少ない種類のHMMの統計的組み合わせにより効率よく表現した音声認識装置を実現する。【構成】入力語を特徴抽出装置4で特徴解析し、対応する特徴ベクトル列、またはラベル付け装置8でラベル列を得る。サブワードの音声として音声変形候補毎に、フェノニック型ヒドン・マルコフ・モデルを語中の先行のサブワードの音声変形候補とのNグラム関係(Nは2以上の整数)を与えパラメータ・テーブル18に保持する。認識装置16によって、認識対象単語発音辞書13の記述候補語に対応し、Nグラム関係に基づいて音声変形候補毎にHMMをあてはめ、音声変形候補毎の各HMMをサブワード間で並列に連結させ音声モデルを構成し、各候補語について構成音声モデルが音声入力された語のラベル列または特徴ベクトル列を出力する確率を求め、最も高い確率の音声モデルに対応する候補語を認識結果として表示装置19へ出力する。
Claim (excerpt):
音声として入力された語のラベル列または特徴ベクトル列を出力する尤度の高い音声モデルを特定することにより、当該語を認識する音声認識に用いる音声モデルにおいて、語を構成するサブワードが音声として変形した音声変形候補毎に、ヒドン・マルコフ・モデルを語中で先行する他のサブワードの音声変形候補とのNグラム関係(Nは2以上の整数)を与えて保持し、音声認識を行う際に、認識対象の語に対応し、且つ、前記Nグラム関係に基づいて音声変形候補の各ヒドン・マルコフ・モデルをサブワード間で並列に連結させて音声モデルを構成することを特徴とする音声モデルの構成方法。
IPC (2):
G10L 3/00 535 ,  G10L 3/00 521

Return to Previous Page