特許
J-GLOBAL ID:200903027173400900

テキストDBからの入力テンプレート作成知識抽出方法

発明者:
出願人/特許権者:
代理人 (1件): 作田 康夫
公報種別:公開公報
出願番号(国際出願番号):特願2002-103346
公開番号(公開出願番号):特開2003-296345
出願日: 2002年04月05日
公開日(公表日): 2003年10月17日
要約:
【要約】【課題】 人手によるテンプレート記述の負担を大幅に軽減しつつ、通常のデータマイニング手法では抽出が不可能であった、きめこまかなテンプレート知識を抽出する。【解決手段】 DB中の文を形態素解析及び掛かり受け解析し、一般化格表現と称する、典型記述パターンの候補となるものを生成する。特定の条件を満たす判断フィールドを持つレコードに現れる所見フィールド内の、単語や一般化格表現の頻度解析により、適度な詳細度を持つテンプレート候補を自動的に生成する。
請求項(抜粋):
事実を描写した文の集合を格納する所見フィールドと、該描写された事実に関するなんらかの判断を述べた文集合を格納する判断フィールドを含むレコードを格納したDBにおいて、判断フィールドがあらかじめ指定した条件を満たすレコードを抽出し、該抽出されたレコード集合中の所見フィールドから、典型記述パターンと呼ぶ、特異的に頻出する文記述のパターンを抽出すること、該抽出された典型記述パターンを提示し、ユーザが選択できること、該選択された典型記述パターンを、レコード抽出に用いた判断フィールドに関する条件と対応付けて記録することを特徴とする知識抽出方法。
IPC (2件):
G06F 17/30 220 ,  G06F 17/28
FI (2件):
G06F 17/30 220 Z ,  G06F 17/28 U
Fターム (12件):
5B075ND03 ,  5B075NK32 ,  5B075NR02 ,  5B075PP13 ,  5B075QM05 ,  5B075UU28 ,  5B091AA15 ,  5B091CA02 ,  5B091CA05 ,  5B091CC04 ,  5B091CC16 ,  5B091DA06

前のページに戻る