特許
J-GLOBAL ID:200903016247277560

形態素解析装置

発明者:
出願人/特許権者:
代理人 (1件): 植本 雅治
公報種別:公開公報
出願番号(国際出願番号):特願平5-351270
公開番号(公開出願番号):特開平7-200595
出願日: 1993年12月30日
公開日(公表日): 1995年08月04日
要約:
【要約】【目的】 辞書検索回数を増加させずに未登録語処理を行なうことができ、また、複数の字種が混じって一単語を構成している未登録語にも良好に対処できる。【構成】 解析文字列が与えられたときに、該解析文字列から単語列を構成する単語候補を生成する単語候補生成部4と、単語列のコスト値を、該単語列を構成する単語候補の出現のしやすさを表す指標としての単語候補の単語コストと単語候補間の連鎖のしやすさを表す指標としての接続コストとの総和により求め、単語列のコスト値が最小の単語列をもっともらしい解とする単語候補検証部5とを有しており、単語候補生成部5は、与えられた解析文字列の部分文字列を表記とする未登録語候補を常に単語候補として生成する。
請求項(抜粋):
単語列のもっともらしさを表す指標として、単語列のコスト値を定め、解析文字列を単語に分割した場合の考えられうる全ての単語列のうち、コスト値が最小の単語列をもっともらしい解として選択する形態素解析装置において、解析文字列が与えられたときに、該解析文字列から単語列を構成する単語候補を生成する単語候補生成手段と、単語列のコスト値を、該単語列を構成する単語候補の出現のしやすさを表す指標としての単語候補の単語コストと単語候補間の連鎖のしやすさを表す指標としての接続コストとの総和により求め、該単語列のコスト値が最小の単語列をもっともらしい解とする単語候補検証手段とを有しており、前記単語候補生成手段は、与えられた解析文字列の部分文字列を表記とする通常単語候補の他に、与えられた解析文字列の各文字1文字分を表記とする未登録語候補を常に単語候補として生成するようになっていることを特徴とする形態素解析装置。
IPC (2件):
G06F 17/27 ,  G06F 17/22
FI (2件):
G06F 15/38 E ,  G06F 15/20 514 U

前のページに戻る