特許
J-GLOBAL ID:200903032336828818

相互に関係する固有表現の組抽出装置及びその方法

発明者:
出願人/特許権者:
代理人 (1件): 吉田 精孝
公報種別:公開公報
出願番号(国際出願番号):特願2007-058794
公開番号(公開出願番号):特開2008-225565
出願日: 2007年03月08日
公開日(公表日): 2008年09月25日
要約:
【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出し、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現が、固有表現の組に対応する各固有表現が他のテキストに共に現れるときの相互情報量を少なくとも含む素性を抽出し、抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。【選択図】図1
請求項(抜粋):
相互に関係する複数の固有表現からなる固有表現の組を入力テキストから抽出する装置であって、 テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出する固有表現抽出処理部と、 固有表現抽出処理部によって抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現が他のテキストに共に現れるときの各固有表現間の関係の度合を表す統計情報を少なくとも含む素性を抽出する素性抽出処理部と、 素性抽出処理部によって抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて素性抽出処理部から事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する判別処理部とを備えた ことを特徴とする相互に関係する固有表現の組抽出装置。
IPC (1件):
G06F 17/28
FI (1件):
G06F17/28 U
Fターム (7件):
5B091AA15 ,  5B091AB06 ,  5B091CA02 ,  5B091CA05 ,  5B091CC05 ,  5B091CC16 ,  5B091EA25
引用特許:
審査官引用 (1件)
引用文献:
前のページに戻る