特許
J-GLOBAL ID:200903090462468142

統計的言語モデル生成装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-264656
公開番号(公開出願番号):特開2000-099085
出願日: 1998年09月18日
公開日(公表日): 2000年04月07日
要約:
【要約】【課題】 パラメータ数を増大させずに、遷移確率の予測精度及び信頼性を改善することができる統計的言語モデルを生成する。【解決手段】 言語モデル生成部20は、学習用テキストデータメモリ13内の学習用テキストデータに基づいてすべての単語をそれぞれ、処理対象の単語の前に接続される単語の品詞属性に基づくtoクラスの品詞クラスに分類し、処理対象の単語の後に接続される単語の品詞属性に基づくfromクラスの品詞クラスに分類する。次いで、複数の単語が連続したときに固有の読みが与えられる結合単語についてtoクラスについて結合単語内の最先の単語の品詞クラスにクラス分類し、fromクラスについて結合単語内の最後の単語の品詞クラスにクラス分類した後、処理対象の単語の前の接続と後ろの接続毎に複数の品詞クラスを有する多重クラスN-gramの出現確率を計算してその統計的言語モデルを生成する。
請求項(抜粋):
所定の話者の発声音声文を書き下した学習用テキストデータに基づいて、すべての単語をそれぞれ、処理対象の単語の前に接続される単語の品詞属性に基づくtoクラスの品詞クラスに分類する第1の分類手段と、上記学習用テキストデータに基づいて、すべての単語をそれぞれ、処理対象の単語の後に接続される単語の品詞属性に基づくfromクラスの品詞クラスに分類する第2の分類手段と、複数の単語が連続したときに固有の読みが与えられる複数の単語の列である所定の結合単語について、toクラスの品詞クラスについて結合単語内の最先の単語の品詞クラスにクラス分類する一方、fromクラスの品詞クラスについて結合単語内の最後の単語の品詞クラスにクラス分類する第3の分類手段と、上記第1の分類手段と上記第2の分類手段と上記第3の分類手段とによってクラス分類された単語データに基づいて、処理対象の単語の前の接続と後ろの接続毎に複数の品詞クラスを有する多重クラスN-gramの出現確率を計算することにより多重クラスN-gramの統計的言語モデルを生成する第1の生成手段とを備えたことを特徴とする統計的言語モデル生成装置。
IPC (2件):
G10L 15/18 ,  G06F 17/27
FI (3件):
G10L 3/00 537 D ,  G10L 3/00 537 G ,  G06F 15/38 D
Fターム (7件):
5B091AA15 ,  5B091CB12 ,  5B091EA01 ,  5B091EA24 ,  5D015AA05 ,  5D015HH23 ,  5D015LL01

前のページに戻る