Pat
J-GLOBAL ID:200903032336828818

相互に関係する固有表現の組抽出装置及びその方法

Inventor:
Applicant, Patent owner:
Agent (1): 吉田 精孝
Gazette classification:公開公報
Application number (International application number):2007058794
Publication number (International publication number):2008225565
Application date: Mar. 08, 2007
Publication date: Sep. 25, 2008
Summary:
【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出し、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現が、固有表現の組に対応する各固有表現が他のテキストに共に現れるときの相互情報量を少なくとも含む素性を抽出し、抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。【選択図】図1
Claim (excerpt):
相互に関係する複数の固有表現からなる固有表現の組を入力テキストから抽出する装置であって、 テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出する固有表現抽出処理部と、 固有表現抽出処理部によって抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現が他のテキストに共に現れるときの各固有表現間の関係の度合を表す統計情報を少なくとも含む素性を抽出する素性抽出処理部と、 素性抽出処理部によって抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて素性抽出処理部から事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する判別処理部とを備えた ことを特徴とする相互に関係する固有表現の組抽出装置。
IPC (1):
G06F 17/28
FI (1):
G06F17/28 U
F-Term (7):
5B091AA15 ,  5B091AB06 ,  5B091CA02 ,  5B091CA05 ,  5B091CC05 ,  5B091CC16 ,  5B091EA25
Patent cited by the Patent:
Cited by examiner (1)
Article cited by the Patent:
Return to Previous Page