Pat
J-GLOBAL ID:200903094943257744
統計的言語モデル生成装置及び音声認識装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
青山 葆 (外2名)
Gazette classification:公開公報
Application number (International application number):1997002733
Publication number (International publication number):1998198395
Application date: Jan. 10, 1997
Publication date: Jul. 31, 1998
Summary:
【要約】【課題】 遷移確率の予測精度及び信頼性を改善可能な統計的言語モデルを生成し、統計的言語モデルを用いてより高い音声認識率で音声認識する。【解決手段】 複数のタスク毎の学習用テキストデータに基づいて最尤推定法を用いて各タスク毎に単語N-gramの遷移確率を演算し、当該遷移確率の出現分布を事前知識の確率分布と仮定し、各タスク毎の確率分布の加重平均及び加重分散を演算した後、演算された加重平均と加重分散に基づいて事前知識の確率分布のパラメータを演算する。次いで、演算された事前知識の確率分布のパラメータと、学習用テキストデータ内の特定タスクのテキストデータの事後知識における処理対象の単語列の直前の単語列の出現回数と、処理対象の単語列の出現回数とに基づいて各タスク毎の単語N-gramの遷移確率を計算することにより統計的言語モデルを生成する。また、当該統計的言語モデルを用いて音声認識する。
Claim (excerpt):
所定の複数のタスク毎の学習用テキストデータに基づいて最尤推定法を用いて各タスク毎に単語のN-gram(Nは2以上の自然数である。)の遷移確率を演算する第1の演算手段と、上記第1の演算手段によって演算された各タスク毎の単語のN-gramの遷移確率の出現分布を事前知識の所定の確率分布と仮定し、各タスク毎の確率分布の加重平均及び加重分散を演算した後、演算された加重平均と加重分散に基づいて事前知識の確率分布のパラメータを演算する第2の演算手段と、上記第2の演算手段によって演算された事前知識の確率分布のパラメータと、上記学習用テキストデータ内の特定タスクのテキストデータの事後知識における処理対象の単語列の直前の単語列の出現回数と、処理対象の単語列の出現回数とに基づいて、各タスク毎の単語のN-gramの遷移確率を計算することにより、各タスク毎の単語のN-gramの遷移確率を含む統計的言語モデルを生成する第3の演算手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (4):
G10L 3/00 535
, G10L 3/00 531
, G10L 3/00 561
, G10L 5/06
FI (4):
G10L 3/00 535
, G10L 3/00 531 F
, G10L 3/00 561 G
, G10L 5/06 D
Return to Previous Page