特許
J-GLOBAL ID:200903025764117628

ヒドン・マルコフ・モデルの学習方法

発明者:
出願人/特許権者:
代理人 (1件): 柿本 恭成
公報種別:公開公報
出願番号(国際出願番号):特願平6-029291
公開番号(公開出願番号):特開平7-239695
出願日: 1994年02月28日
公開日(公表日): 1995年09月12日
要約:
【要約】【目的】 連結学習法で文音声から音素HMMを学習するとき、「が」行音声の鼻音化又は長音発声の違いに伴った音声データと音素表記の不一致を解消し、精度の高い音素HMMの学習を行う。【構成】 文音声を用いて音素HMMを学習するとき、先ず、ステップ5で、入力された文音声に付属する音素表記情報を用いて、認識用音素HMM辞書4を参照しながら、「が」行音節のある箇所に/g/と/ng/を代入して文HMMを生成する。ステップ6で、これらの文HMMと入力音声とを照合し、尤度を計算して音韻表記決定した後、ステップ7で音素HMMを連結して文HMMを生成する。ステップ8で、文HMMの学習を行い、ステップ9で文HMMを音素HMMに分解した後、ステップ12で音素HMMが収束したか否かの判定を行い、収束していなければ、ステップ11において、ステップ8の文HMMの学習へ戻り、学習処理と分解処理を繰り返す。
請求項(抜粋):
連続音声データを用いて音素ヒドン・マルコフ・モデルを学習するに際して、音素ヒドン・マルコフ・モデルの初期モデルを連結して文ヒドン・マルコフ・モデルを構築し、前記文ヒドン・マルコフ・モデルを学習する学習処理と、前記学習処理後にその学習結果を音素ヒドン・マルコフ・モデルに分解する分解処理と、前記分解された音素ヒドン・マルコフ・モデルを再構築して文ヒドン・マルコフ・モデルを作る連結処理とを用い、前記学習処理、分解処理、及び連結処理を繰り返すことによって前記音素ヒドン・マルコフ・モデルを学習するヒドン・マルコフ・モデルの学習方法において、学習用文音声データに含まれる「が」行音節又は「が」行拗音が鼻音化されたかどうかを音声認識手法で検出し、前記音素ヒドン・マルコフ・モデルを連結して前記文ヒドン・マルコフ・モデルを生成する際、前記認識結果に従い相応するヒドン・マルコフ・モデルを連結して学習し、該音素ヒドン・マルコフ・モデルを学習することを特徴とするヒドン・マルコフ・モデルの学習方法。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 521

前のページに戻る