特許
J-GLOBAL ID:200903042635143924

単語分類処理装置及び音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 青山 葆 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-056918
公開番号(公開出願番号):特開平8-254990
出願日: 1995年03月16日
公開日(公表日): 1996年10月01日
要約:
【要約】【目的】 出現頻度の低い単語であっても適切に分類することができる単語分類処理装置を提供する。【構成】 単語のn-グラムを利用して、同一の単語に隣接する割合の多い単語を同一のクラスに割り当てるという基準で複数の単語を複数のクラスに分類し、分類された複数の単語に対して、すべての単語の出現頻度を調べ、互いに異なる第1のクラスの単語と第2のクラスの単語とが隣接して出現する頻度を、上記第1のクラスの単語の出現頻度と第2のクラスの単語の出現頻度との積に対する相対的な頻度の割合を表わす所定の相互情報量が最大となるように、上記複数の単語を二分木の形式で複数のクラスに分類する。
請求項(抜粋):
単語のn-グラムを利用して、同一の単語に隣接する割合の多い単語を同一のクラスに割り当てるという基準で複数の単語を複数のクラスに分類する第1の分類手段と、上記第1の分類手段によって分類された複数の単語に対して、すべての単語の出現頻度を調べ、互いに異なる第1のクラスの単語と第2のクラスの単語とが隣接して出現する頻度を、上記第1のクラスの単語の出現頻度と第2のクラスの単語の出現頻度との積に対する相対的な頻度の割合を表わす所定の相互情報量が最大となるように、上記複数の単語を二分木の形式で複数のクラスに分類する第2の分類手段とを備えたことを特徴とする単語分類処理装置。
IPC (2件):
G10L 3/00 535 ,  G10L 3/00 561
FI (2件):
G10L 3/00 535 ,  G10L 3/00 561 G

前のページに戻る