特許
J-GLOBAL ID:200903094943257744
統計的言語モデル生成装置及び音声認識装置
発明者:
,
出願人/特許権者:
代理人 (1件):
青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-002733
公開番号(公開出願番号):特開平10-198395
出願日: 1997年01月10日
公開日(公表日): 1998年07月31日
要約:
【要約】【課題】 遷移確率の予測精度及び信頼性を改善可能な統計的言語モデルを生成し、統計的言語モデルを用いてより高い音声認識率で音声認識する。【解決手段】 複数のタスク毎の学習用テキストデータに基づいて最尤推定法を用いて各タスク毎に単語N-gramの遷移確率を演算し、当該遷移確率の出現分布を事前知識の確率分布と仮定し、各タスク毎の確率分布の加重平均及び加重分散を演算した後、演算された加重平均と加重分散に基づいて事前知識の確率分布のパラメータを演算する。次いで、演算された事前知識の確率分布のパラメータと、学習用テキストデータ内の特定タスクのテキストデータの事後知識における処理対象の単語列の直前の単語列の出現回数と、処理対象の単語列の出現回数とに基づいて各タスク毎の単語N-gramの遷移確率を計算することにより統計的言語モデルを生成する。また、当該統計的言語モデルを用いて音声認識する。
請求項(抜粋):
所定の複数のタスク毎の学習用テキストデータに基づいて最尤推定法を用いて各タスク毎に単語のN-gram(Nは2以上の自然数である。)の遷移確率を演算する第1の演算手段と、上記第1の演算手段によって演算された各タスク毎の単語のN-gramの遷移確率の出現分布を事前知識の所定の確率分布と仮定し、各タスク毎の確率分布の加重平均及び加重分散を演算した後、演算された加重平均と加重分散に基づいて事前知識の確率分布のパラメータを演算する第2の演算手段と、上記第2の演算手段によって演算された事前知識の確率分布のパラメータと、上記学習用テキストデータ内の特定タスクのテキストデータの事後知識における処理対象の単語列の直前の単語列の出現回数と、処理対象の単語列の出現回数とに基づいて、各タスク毎の単語のN-gramの遷移確率を計算することにより、各タスク毎の単語のN-gramの遷移確率を含む統計的言語モデルを生成する第3の演算手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (4件):
G10L 3/00 535
, G10L 3/00 531
, G10L 3/00 561
, G10L 5/06
FI (4件):
G10L 3/00 535
, G10L 3/00 531 F
, G10L 3/00 561 G
, G10L 5/06 D
前のページに戻る