Pat
J-GLOBAL ID:200903027173400900

テキストDBからの入力テンプレート作成知識抽出方法

Inventor:
Applicant, Patent owner:
Agent (1): 作田 康夫
Gazette classification:公開公報
Application number (International application number):2002103346
Publication number (International publication number):2003296345
Application date: Apr. 05, 2002
Publication date: Oct. 17, 2003
Summary:
【要約】【課題】 人手によるテンプレート記述の負担を大幅に軽減しつつ、通常のデータマイニング手法では抽出が不可能であった、きめこまかなテンプレート知識を抽出する。【解決手段】 DB中の文を形態素解析及び掛かり受け解析し、一般化格表現と称する、典型記述パターンの候補となるものを生成する。特定の条件を満たす判断フィールドを持つレコードに現れる所見フィールド内の、単語や一般化格表現の頻度解析により、適度な詳細度を持つテンプレート候補を自動的に生成する。
Claim (excerpt):
事実を描写した文の集合を格納する所見フィールドと、該描写された事実に関するなんらかの判断を述べた文集合を格納する判断フィールドを含むレコードを格納したDBにおいて、判断フィールドがあらかじめ指定した条件を満たすレコードを抽出し、該抽出されたレコード集合中の所見フィールドから、典型記述パターンと呼ぶ、特異的に頻出する文記述のパターンを抽出すること、該抽出された典型記述パターンを提示し、ユーザが選択できること、該選択された典型記述パターンを、レコード抽出に用いた判断フィールドに関する条件と対応付けて記録することを特徴とする知識抽出方法。
IPC (2):
G06F 17/30 220 ,  G06F 17/28
FI (2):
G06F 17/30 220 Z ,  G06F 17/28 U
F-Term (12):
5B075ND03 ,  5B075NK32 ,  5B075NR02 ,  5B075PP13 ,  5B075QM05 ,  5B075UU28 ,  5B091AA15 ,  5B091CA02 ,  5B091CA05 ,  5B091CC04 ,  5B091CC16 ,  5B091DA06

Return to Previous Page