特許
J-GLOBAL ID:200903054822333662

統計的言語モデル生成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-292685
公開番号(公開出願番号):特開平9-134192
出願日: 1995年11月10日
公開日(公表日): 1997年05月20日
要約:
【要約】【課題】 遷移確率の予測精度及び信頼性を改善可能な統計的言語モデルを生成することができる統計的言語モデル生成装置、及び統計的言語モデルを用いてより高い音声認識率で音声認識することができる音声認識装置を提供する。【解決手段】 品詞クラス間のバイグラムを初期状態の統計的言語モデルとし、単語の品詞クラスからの分離可能な第1の分離クラス候補と、連接単語又は単語列の結合によって単語の品詞クラスから分離可能な第2の分離クラス候補とを検索し、次単語の予測の難易度を表わすエントロピーを用いて、クラスを分離することによるエントロピーの減少量を計算する。計算されたエントロピーの減少量の中で最大のクラス分離を選択してクラス分離を実行することにより、品詞のバイグラムと可変長Nの単語のN-グラムとを含む統計的言語モデルを生成し、所定のクラス数になるまで上記処理を繰り返す。また、当該統計的言語モデルを用いて音声認識する。
請求項(抜粋):
所定の話者の発声音声文を書き下した学習用テキストデータに基づいて、すべての語彙を品詞毎にクラスタリングされた品詞クラスに分類し、それらの品詞クラス間のバイグラムを初期状態の統計的言語モデルとして生成する生成手段と、上記生成手段によって生成された初期状態の統計的言語モデルに基づいて、単語の品詞クラスからの分離することができる第1の分離クラス候補と、1つの単語と1つの単語との結合、1つの単語と複数の単語の単語列との結合、複数の単語の単語列と1つの単語との結合、複数の単語の単語列と、複数の単語の単語列との結合とを含む連接単語又は連接単語列の結合によって単語の品詞クラスから分離することができる第2の分離クラス候補とを検索する検索手段と、上記検索手段によって検索された第1と第2の分離クラス候補に対して、次単語の予測の難易度を表わす所定のエントロピーを用いて、クラスを分離することによる当該エントロピーの減少量を計算する計算手段と、上記計算手段によって計算された上記第1と第2の分離クラス候補に対するエントロピーの減少量の中で最大のクラス分離を選択して、選択されたクラスの分離を実行することにより、品詞のバイグラムと可変長Nの単語のN-グラムとを含む統計的言語モデルを生成する分離手段と、上記分離手段によって生成された統計的言語モデルのクラス数が所定のクラス数になるまで、上記分離手段によって生成された統計的言語モデルを処理対象モデルとして、上記検索手段の処理と、上記計算手段の処理と、上記分離手段の処理とを繰り返すことにより、所定のクラス数を有する統計的言語モデルを生成する制御手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 561
FI (2件):
G10L 3/00 535 ,  G10L 3/00 561 G

前のページに戻る