特許
J-GLOBAL ID:200903074131736346

統計的言語モデル生成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-243024
公開番号(公開出願番号):特開2000-075886
出願日: 1998年08月28日
公開日(公表日): 2000年03月14日
要約:
【要約】【課題】 遷移確率の予測精度及び信頼性を改善可能な統計的言語モデルを生成し、統計的言語モデルを用いてより高い音声認識率で音声認識する。【解決手段】 学習用テキストデータ全体をクラスタリング処理部40によって自動的にクラスタリングしてクラスタ毎のテキストデータをメモリ21に記憶し、言語モデル生成部42によりMAP推定法を用いて各クラスタ毎の統計的言語モデルを生成してメモリ32に記憶する。一方、学習用テキストデータ全体に対して統計的言語モデルを生成してメモリ31に記憶する。単語照合部4による単語仮説の生成の後、単語仮説絞込部6aはメモリ31内の統計的言語モデルを用いて単語仮説の絞込処理を実行した後、言語モデル選択部8はメモリ32内の各クラスタの統計的言語モデルのうちで文生成確率が最大のモデルを選択して、単語仮説絞込部6bは選択されたモデルを用いて再度の絞込処理を行って認識結果を出力する。
請求項(抜粋):
複数のクラスタの統計的言語モデルを記憶する記憶手段と、所定の複数の発声音声文を含む学習用テキストデータに基づいて各発声音声文に対する統計的言語モデルを生成して、各発声音声文が各クラスタに対応するように、上記生成した統計的言語モデルを上記記憶手段に記憶する初期化手段と、上記学習用テキストデータの各発声音声文について、各クラスタにおける統計的言語モデルの文生成確率を計算して最大の文生成確率を有するクラスタを選択してその発声音声文を所属させるように上記記憶手段に記憶するクラスタ選択手段と、発声音声文が属するクラスタが変化したときに、各クラスタ毎に、上記クラスタ選択手段によって選択された発声音声文を用いて上記記憶手段に記憶された各統計的言語モデルを更新して、各クラスタに対応した統計的言語モデルを生成するモデル変更手段と、上記複数の発声音声文に属するクラスタが1文も変化しなくなるまで、上記クラスタ選択手段の処理と、上記モデル変更手段の処理を繰り返す制御手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (2件):
G10L 15/06 ,  G10L 15/10
FI (2件):
G10L 3/00 521 G ,  G10L 3/00 531 D
Fターム (3件):
5D015GG01 ,  5D015GG05 ,  5D015HH14

前のページに戻る