特許
J-GLOBAL ID:200903048073762748

統計的言語モデル圧縮方法

発明者:
出願人/特許権者:
代理人 (1件): 草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願平9-107338
公開番号(公開出願番号):特開平10-301596
出願日: 1997年04月24日
公開日(公表日): 1998年11月13日
要約:
【要約】【課題】 音声認識性能を劣化することなく、簡単にデータ量を減少する。【解決手段】 固定長n-gramの統計的言語モデルの1-gram,2-gram,...,n-gramについて各頻度しきい値t1 ,t2 ,...,tn を全て1にし(S1)、そのt1 〜tn の中の各1つについて、それぞれ1増加したしきい値組により木構造モデル中の各ノードの出現頻度が小さいものと、これ以後に連鎖するノードを削除した新モデルをn個作り(S2)、これらn個の新モデルから最も良好なものを選択し(S4)、この選択した新モデル作成時のしきい値組を新たな設定しきい値としてステップS2に戻り、同様のことを繰返し、新モデルが使用メモリの容量から決る制限、又は、モデル性能の指標に達すると所望のモデルとする。
請求項(抜粋):
統計量をとる単位がn個連鎖され、各ノードにその単位の連鎖の出現頻度情報が与えられている固定長のnグラム(gram)統計的言語モデルから、出現頻度しきい値より小さい出現頻度の単位を削除する圧縮方法において、単位の1個組、2個組、...、n個組にそれぞれ独立に出現頻度しきい値を設定することを特徴とする統計的言語モデル圧縮方法。

前のページに戻る