Pat
J-GLOBAL ID:200903016247277560
形態素解析装置
Inventor:
Applicant, Patent owner:
Agent (1):
植本 雅治
Gazette classification:公開公報
Application number (International application number):1993351270
Publication number (International publication number):1995200595
Application date: Dec. 30, 1993
Publication date: Aug. 04, 1995
Summary:
【要約】【目的】 辞書検索回数を増加させずに未登録語処理を行なうことができ、また、複数の字種が混じって一単語を構成している未登録語にも良好に対処できる。【構成】 解析文字列が与えられたときに、該解析文字列から単語列を構成する単語候補を生成する単語候補生成部4と、単語列のコスト値を、該単語列を構成する単語候補の出現のしやすさを表す指標としての単語候補の単語コストと単語候補間の連鎖のしやすさを表す指標としての接続コストとの総和により求め、単語列のコスト値が最小の単語列をもっともらしい解とする単語候補検証部5とを有しており、単語候補生成部5は、与えられた解析文字列の部分文字列を表記とする未登録語候補を常に単語候補として生成する。
Claim (excerpt):
単語列のもっともらしさを表す指標として、単語列のコスト値を定め、解析文字列を単語に分割した場合の考えられうる全ての単語列のうち、コスト値が最小の単語列をもっともらしい解として選択する形態素解析装置において、解析文字列が与えられたときに、該解析文字列から単語列を構成する単語候補を生成する単語候補生成手段と、単語列のコスト値を、該単語列を構成する単語候補の出現のしやすさを表す指標としての単語候補の単語コストと単語候補間の連鎖のしやすさを表す指標としての接続コストとの総和により求め、該単語列のコスト値が最小の単語列をもっともらしい解とする単語候補検証手段とを有しており、前記単語候補生成手段は、与えられた解析文字列の部分文字列を表記とする通常単語候補の他に、与えられた解析文字列の各文字1文字分を表記とする未登録語候補を常に単語候補として生成するようになっていることを特徴とする形態素解析装置。
IPC (2):
FI (2):
G06F 15/38 E
, G06F 15/20 514 U
Return to Previous Page