Pat
J-GLOBAL ID:200903025568241485
形態素解析装置、方法及びプログラム
Inventor:
Applicant, Patent owner:
Agent (1):
工藤 宣幸
Gazette classification:公開公報
Application number (International application number):2004206996
Publication number (International publication number):2006031228
Application date: Jul. 14, 2004
Publication date: Feb. 02, 2006
Summary:
【課題】 未知語を含む文章の形態素解析結果を、計算量などを増大させることなく、より高精度にする。【解決手段】 本発明では、解析対象文に対する形態素解析結果の候補である仮説として、辞書に登録されている既知語の仮説と、未知語を構成する文字単位の仮説とが混在したものを生成し、各仮説の生成確率を、形態素やn-gramや未知語を構成する文字の、予め用意されている確率的なモデルの情報を用いて計算する。そして、解となる仮説を探索する。探索された解の中に未知語を構成する文字がある場合には、それらの文字を結合して未知語を復元する。【選択図】 図1
Claim (excerpt):
形態素解析対象文に対して、形態素解析結果の候補である仮説を1又は複数生成するものであって、生成する仮説の中に、辞書に登録されている既知語の仮説と、未知語を構成する文字単位の仮説とが混在したものがある仮説生成手段と、
形態素やn-gramや未知語を構成する文字の確率的なモデルの情報を格納しているモデル格納手段と、
上記各仮説に対し、その仮説の生成確率を、上記モデル格納手段に格納されている確率的なモデルの情報を用いて求める生成確率計算手段と、
上記各仮説の生成確率に基づき、解となる仮説を探索する解探索手段と、
探索された解の中に未知語を構成する文字がある場合に、それらの文字を結合して未知語を復元する未知語復元手段と
を備えたことを特徴とする形態素解析装置。
IPC (2):
FI (2):
G06F17/27 E
, G10L3/00 537D
F-Term (8):
5B091AA15
, 5B091CA02
, 5B091CC01
, 5B091EA01
, 5B091EA24
, 5D015AA04
, 5D015BB01
, 5D015CC17
Patent cited by the Patent:
Cited by applicant (1)
Cited by examiner (1)
Return to Previous Page