統計的言語モデルの作成方法

発明者：
出願人/特許権者：
代理人 (1件)：鈴木誠
公報種別：公開公報
出願番号（国際出願番号）：特願平9-250356
公開番号（公開出願番号）：特開平11-085179
出願日： 1997年09月16日
公開日（公表日）： 1999年03月30日
要約：

【要約】【課題】連続音声認識用のより高度な統計的言語モデルを作成するための、より優れた初期クラスを提供する。【解決手段】単語列w1,w2,・・・,wi-1が発声された後に、単語wiが発声される確率P(wi|w1,w2,・・・,wi-1)を、単語wiの属する単語クラスタCiを用いて確率P(wi|Ci)P(Ci|C1,C2,・・・,Ci-1)と近似して求める統計的言語モデルにおいて、クラスタの初期セットを品詞等の言語的知識と単語間の距離に基づき自動クラスタリングにより設定する。また、クラスタリングで、当該単語の直前直後の単語の出現頻度分布の違いの大きさを単語間距離として設定する。さらに、クラスタリングで、クラス分割をクラスバイグラムのエントロピー基準で繰り返し分割していき、初期クラスを設定する。

請求項（抜粋）：

単語列w1,w2,・・・,wi-1が発声された後に、単語wが発声される確率P(wi|w1,w2,・・・,wi-1)を、単語wiの属する単語クラスタCiを用いて、確率P(wi|Ci)P(Ci|C1,C2,・・・,Ci-1)と近似して求める統計的言語モデルにおいて、上記クラスタの初期セットを品詞等の言語的知識と単語間の距離に基づいて自動クラスタリングにより設定することを特徴とする統計的言語モデルの作成方法。

IPC (2件)：

G10L 3/00 521 , G10L 3/00 561

FI (2件)：

G10L 3/00 521 C , G10L 3/00 561 G

引用特許：

審査官引用 (2件)

統計的言語モデル生成装置及び音声認識装置
公報種別：公開公報出願番号：特願平7-292685 出願人：株式会社エイ・ティ・アール音声翻訳通信研究所
単語分類処理装置及び音声認識装置
公報種別：公開公報出願番号：特願平7-056918 出願人：株式会社エイ・ティ・アール音声翻訳通信研究所

前のページに戻る