Pat
J-GLOBAL ID:200903023646076078

表構造領域からの情報抽出方法および装置と情報抽出プログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 三好 秀和 (外1名)
Gazette classification:公開公報
Application number (International application number):2000140478
Publication number (International publication number):2001325284
Application date: May. 12, 2000
Publication date: Nov. 22, 2001
Summary:
【要約】【課題】 表構造領域に記述された特定分野の主要な情報を他の情報との統合が容易であるように構造および表記方法を統一した表形式で抽出可能にする表構造領域からの情報抽出方法および装置と情報抽出プログラムを記録した記録媒体を提供する。【解決手段】 表構造情報記憶部121に記憶されている表構造情報中の各表構造要素の情報に含まれる固有情報を認識し、分野用語辞書を用いて各表構造要素の情報に含まれる分野用語を認識して代表表記に読み替え、各表構造要素中の固有表現および分野用語の意味的な関係および情報の一致を各表構造要素間で比較して表構造情報を評価し、属性名を表す表構造要素が連なる属性名領域とその方向および他の表構造要素が連なる属性値領域を判定し、属性名領域に属する表構造要素と属性値領域に属する表構造要素を対とする属性名領域の方向でまとめた抽出情報を生成する。
Claim (excerpt):
入力情報から特定分野における主要な情報を抽出する情報抽出方法であって、行と列からなる表構造情報を入力し、この入力された表構造情報中の各表構造要素の情報に含まれる固有情報を認識し、対象分野に特有の用語の意味的な関係を体系化した分野用語辞書を用いて、前記表構造情報中の各表構造要素の情報に含まれる分野用語を認識し、該情報を前記分野用語の代表表記に読み替え、前記認識された各表構造要素中の固有表現および分野用語の意味的な関係および情報の一致を各表構造要素間で比較することによって表構造情報を評価して、属性名を表す表構造要素が連なる属性名領域とその方向およびその他の表構造要素が連なる属性値領域を判定し、属性名領域に属する表構造要素と属性値領域に属する表構造要素を対とする属性名領域の方向でまとめた抽出情報を生成することを特徴とする表構造領域からの情報抽出方法。
IPC (2):
G06F 17/30 320 ,  G06F 17/30 170
FI (2):
G06F 17/30 320 D ,  G06F 17/30 170 A
F-Term (3):
5B075ND03 ,  5B075NK34 ,  5B075PQ02

Return to Previous Page