特許
J-GLOBAL ID:200903071538567400

ヒドン・マルコフ・モデルの学習方法

発明者:
出願人/特許権者:
代理人 (1件): 柿本 恭成
公報種別:公開公報
出願番号(国際出願番号):特願平7-017560
公開番号(公開出願番号):特開平8-211891
出願日: 1995年02月06日
公開日(公表日): 1996年08月20日
要約:
【要約】【目的】 連結学習法で文音声から音素HMMを学習するとき、自動的にポーズ、鼻濁音、長音を検出して学習精度の高い音素HMMの学習を行う。【構成】 文音声を用いて音素HMMを学習する時、ステップ5で、学習用文音声データのテキストを解析してポーズが存在し得る箇所を検出し、ステップ7で、学習用文音声データに含まれているポーズ、鼻濁音、長音を音声認識手法で検出する。ステップ8でHMM尤度を計算して音韻表記を決定した後、ステップ9でその音素HMMを連結して文HMMを構成する。ステップ10で文HMMの学習を行い、ステップ11で文HMMを音素HMMに分解した後、ステップ14で音素HMMが収束したか否かの判定を行い、収束していなければ、ステップ13において、ステップ11で分解された音素HMMを連結して文HMMを再構成し、ステップ10の文HMMの学習へ戻り、学習及び分解を繰り返す。
請求項(抜粋):
連続音声データを用いて音素ヒドン・マルコフ・モデルを学習するに際して、音素ヒドン・マルコフ・モデルの初期モデルを連結して文ヒドン・マルコフ・モデルを構築し、前記文ヒドン・マルコフ・モデルを学習する学習処理と、前記学習処理後にその学習結果を音素ヒドン・マルコフ・モデルに分解する分解処理と、前記分解された音素ヒドン・マルコフ・モデルを再連結して文ヒドン・マルコフ・モデルを作る連結処理とを行い、前記学習処理、分解処理、及び連結処理を繰り返すことによって前記音素ヒドン・マルコフ・モデルを学習するヒドン・マルコフ・モデルの学習方法において、学習用文音声データのテキスト表記を単語列又は文節列に分解することにより該学習用文音声データ中のポーズが存在し得る箇所を探りだすと共に該学習用文音声データのテキスト表記を仮名表記の単語列又は文節列に変換し、該学習用文音声データ中に含まれているポーズ、鼻濁音、及び長音を音声認識手法で検出し、前記音素ヒドン・マルコフ・モデルを連結して前記文ヒドン・マルコフ・モデルを生成する際、該認識結果に従い該ポーズ、鼻濁音、及び長音に相応する音素ヒドンマルコフモデルを連結して学習し、前記音素ヒドン・マルコフ・モデルを学習することを特徴とするヒドン・マルコフ・モデルの学習方法。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 521

前のページに戻る