Pat
J-GLOBAL ID:200903016171841886

単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、

Inventor:
Applicant, Patent owner:
Agent (3): 坂口 博 ,  市位 嘉宏 ,  上野 剛史
Gazette classification:公開公報
Application number (International application number):2004207864
Publication number (International publication number):2006031295
Application date: Jul. 14, 2004
Publication date: Feb. 02, 2006
Summary:
【課題】単語分割済みの第1のコーパスと単語非分割の第2のコーパスを有効に利用して、単語の n-gram 確率を高い精度で計算し、自然言語処理の認識精度を上げる装置及び手法を提供する。【解決手段】<単語分割済みコーパスの利用法> 第1のコーパス(単語分割済み)は n-gram を求めるのと、隣り合う2文字の間が単語境界になる確率(分割確率)を求めるのに用いる。第2のコーパス(単語非分割)は、第1のコーパス(単語分割済み)の情報を元に確率的な単語境界が割り当てられ、単語 n-gram を計算するのに用いる。<確率的単語境界の計算> 第2のコーパス(単語非分割)において、第1のコーパス(単語分割済み)で計算した分割確率を各文字の間に割り当てる。<文字単位の未知語モデル> 文字単位で、文字と読みの対応関係をモデル化する。このことにより、未知語に対する仮名漢字変換モデルが提案される。【選択図】 図4
Claim (excerpt):
複数の文字から形成された文字列が記憶されている第1のコーパスから複数の文字の間に単語境界が既にあるかどうかの情報を呼び出すか又は単語境界があるかどうかについての予備的情報を設定することによって、第1のコーパスに記憶されている文字列を形成している複数の文字の間に単語境界が存在するであろう確率を計算して、その計算された結果を第2のコーパスに記憶されている文字列を形成している複数の文字の間に参照して、第2のコーパスの文字列を形成している複数の文字の間に単語境界が存在するであろう確率を推定する、 単語境界確率推定装置。
IPC (2):
G06F 17/27 ,  G10L 15/18
FI (2):
G06F17/27 E ,  G10L3/00 537D
F-Term (8):
5B091CA02 ,  5B091CC01 ,  5B091EA02 ,  5B091EA24 ,  5D015AA04 ,  5D015BB01 ,  5D015CC17 ,  5D015HH23

Return to Previous Page