特許
J-GLOBAL ID:200903046749240534
統計的言語モデル生成装置及び音声認識装置
発明者:
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-168188
公開番号(公開出願番号):特開2000-356997
出願日: 1999年06月15日
公開日(公表日): 2000年12月26日
要約:
【要約】【課題】 少なくとも予測精度、信頼性及び頑健さにおいて優れた性能を有する統計的言語モデルを生成する。【解決手段】 学習用テキストデータに基づいて、単語列の後に処理対象の単語が生起する第1の頻度確率を計算して前向きの単語N-gramを生成する。次いで、学習用テキストデータと品詞クラス情報データとに基づいて、単語の品詞クラス及び当該単語の後に接続される単語列の後に、処理対象の単語が生起する頻度確率を計算することにより前向きの品詞クラス-単語N-gramを生成する。前向きの品詞クラス-単語N-gramを事前知識として用い、前向きの単語N-gramを事後知識として用いて最大事後確率推定法により第1と第2の頻度確率を補間してなる前向きの遷移確率を計算し、正規化処理と平滑化処理を行い前向きのN-gramの統計的言語モデルを生成する。
請求項(抜粋):
所定の話者の発声音声文を書き下した学習用テキストデータに基づいて、複数の単語からなる単語列の後に処理対象の単語が生起する第1の頻度確率を計算することにより前向きの単語N-gramの統計的言語モデルを生成する第1の生成手段と、上記学習用テキストデータと、品詞クラス情報を含む品詞クラス情報データとに基づいて、第1の単語の品詞クラス及び上記第1の単語の後に接続される複数の単語からなる単語列の後に、処理対象の単語が生起する第2の頻度確率を計算することにより前向きの品詞クラス-単語N-gramの統計的言語モデルを生成する第2の生成手段と、上記第2の生成手段によって生成された前向きの品詞クラス-単語N-gramの統計的言語モデルを事前知識として用い、上記第1の生成手段によって生成された前向きの単語N-gramの統計的言語モデルを事後知識として用いて最大事後確率推定法により、第1の頻度確率と第2の頻度確率との間を補間してなる前向きの遷移確率を計算する第1の計算手段と、上記第1の計算手段によって計算された前向きの遷移確率に対して、所定の正規化処理と平滑化処理を実行することにより前向きのN-gramの統計的言語モデルを生成する第1の処理手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (2件):
FI (2件):
G10L 3/00 537 D
, G06F 15/38 D
Fターム (6件):
5B091AA15
, 5B091CB12
, 5B091CC01
, 5B091CC16
, 5B091EA01
, 5D015HH23
前のページに戻る