特許
J-GLOBAL ID:200903091705908819
自動音声認識用の音響プロトタイプを生成する方法及び装置
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
頓宮 孝一 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-155237
公開番号(公開出願番号):特開平5-204392
出願日: 1992年06月15日
公開日(公表日): 1993年08月13日
要約:
【要約】【目的】 高精度音声認識を可能にする音響プロトタイプ集合を高速で生成すること。【構成】 音響プロトタイプ信号集合生成装置として、学習用スクリプト・モデル記憶部10及び初期プロトタイプ・ベクトル記憶部20と、活性音響モデル記憶部28及び活性プロトタイプ・ベクトル記憶部22と、音響マッチングの処理部26と、発声の複数の特徴ベクトル信号を複数のクラスタにまとめるクラスタ処理部30と、修正後のプロトタイプ・ベクトルの記憶部32と、を設ける。
請求項(抜粋):
音声符号化用の音響プロトタイプ信号の集合を生成するための装置であって、イ) 学習用スクリプトのモデルを記憶しておくための学習用スクリプト・モデル記憶手段であって、前記学習用スクリプト・モデルは、一連の複数の単語セグメント・モデルから成る単語セグメント・モデル列で構成し、各該単語セグメント・モデルは、有限個数の複数の単語セグメント・モデルから成る単語セグメント・モデル有限集合の中から選択し、各前記単語セグメント・モデルは、一連の複数の基本モデルから成る基本モデル列で構成し、各該基本モデルは、各単語セグメント・モデルの中の1つの位置を占め、各前記基本モデルは、有限個数の複数の基本モデルから成る基本モデル有限集合の中から選択した、前記の学習用スクリプト・モデル記憶手段と、ロ) 前記学習用スクリプトの発声の継続期間に亙る一連の複数の時区間の各々の間に、該学習用スクリプトの該発声の少なくとも1種類の特徴の値を測定し、それによって、一連の複数の特徴ベクトル信号から成り、それら特徴ベクトル信号の各々が夫々対応した時区間における前記発声の前記少なくとも1種類の特徴の値を表わしている特徴ベクトル信号列を発生する、特徴値測定手段と、ハ) 前記学習用スクリプト・モデルを通る経路のうち、測定して得た複数の特徴ベクトル信号から成る前記特徴ベクトル信号列の全体を発生し得る少なくとも1つの経路を推定し、それによって、それら複数の特徴ベクトル信号の各々に対し、その特徴ベクトル信号を発生し得る前記学習用スクリプト・モデルの中の対応する基本モデルを推定する、推定手段と、ニ) 前記複数の特徴ベクトル信号を複数のクラスタにまとめることによって複数のクラスタ信号を形成するクラスタ化手段であって、1つのクラスタの中の各特徴ベクトル信号が1つの単語セグメント・モデルの中の1つの位置にある1つの基本モデルに対応し、また各前記クラスタ信号は、当該クラスタ内の全ての特徴ベクトル信号の特徴値の平均値に等しいクラスタ値を有する、前記のクラスタ化手段と、ホ) 複数のプロトタイプ・ベクトル信号を記憶しておくためのプロトタイプ・ベクトル信号記憶手段であって、各前記プロトタイプ・ベクトル信号は、1つの基本モデルに対応し、また識別子を有し、かつまた少なくとも2つの区画値で構成されており、それら区画値のうちの少なくとも1つの区画値は、当該基本モデルに対応した1つないし複数のクラスタ信号のクラスタ値を組み合わせた値に等しく、それら区画値のうちの別の少なくとも1つの区画値は、当該基本モデルに対応した別の1つないし複数のクラスタ信号のクラスタ値を組み合わせた値に等しい、前記のプロトタイプ・ベクトル信号記憶手段と、を備えた音響プロトタイプ信号集合生成装置。
IPC (2件):
G10L 3/00 515
, G10L 9/18
前のページに戻る