特許
J-GLOBAL ID:200903049572805640

音声モデルの作成方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平5-156485
公開番号(公開出願番号):特開平7-013592
出願日: 1993年06月28日
公開日(公表日): 1995年01月17日
要約:
【要約】【目的】 連続発声音声データにおける音韻、音素、単語などの単位の境界と、その各音声単位を表す単位HMM(隠れマルコフモデル)の境界とのずれを小さくした単位HMMを作成する。【構成】 学習音声データに対し、どういう順でどれだけの長さで音声単位が出現するかをラベル付けし、またその音声データの各音声単位に対応する単位HMMを初期学習し、その単位HMMにおいて、これを前記ラベルの出現順に連結し、その連結HMMが、音声データをどのような状態遷移の過程で生成したと考えられるかの解析を行い、音声データの単位境界とこれと対応する単位HMMの境界との位置ずれを求め、その位置ずれを少くするように、対応単位HMMの状態数、並びにそれを表わす初期状態確率、終状態確率、状態遷移確率、出力確率を操作する。
請求項(抜粋):
学習音声データに対し、要素とみなせる音声単位が、それぞれどういう順序で、かつどれだけの長さをもって出現するのかをラベル付けし、前記学習音声データの各々の音声単位に対応する区間から、それぞれその音声単位を表す隠れマルコフ・モデル(以下「隠れマルコフ・モデル」は「HMM」と、「それぞれの要素とみなせる音声単位を表すHMM」は「単位HMM」と記す)を初期学習し、その初期学習した単位HMMにおいて、前記音声データに付けられたラベルの出現順に前記単位HMMを連結することによって合成したHMMが、前記音声データをどのような状態遷移の過程をもって生成したと考えられるのかを解析し、前記音声データに付けられた隣接する前記音声単位の境界と、それぞれの前記音声単位に対応する前記単位HMMの境界との位置のずれを求め、前記単位HMMの状態数、並びにそれを表す変数(すなわち初期状態確率、終状態の集合、状態遷移確率、ないしシンボル出力確率の一部または全部)を、隣接する前記音声単位の境界と、それに対応する単位HMMの境界との位置のずれが少なくなるように操作することを特徴とする、音声モデルの作成方法。
IPC (3件):
G10L 3/00 535 ,  G10L 3/00 521 ,  G10L 3/00

前のページに戻る