Pat
J-GLOBAL ID:201003021439656143
情報収集方法、装置及びプログラム
Inventor:
Applicant, Patent owner:
Agent (1):
正林 真之
Gazette classification:公開公報
Application number (International application number):2008171883
Publication number (International publication number):2010015202
Application date: Jun. 30, 2008
Publication date: Jan. 21, 2010
Summary:
【課題】Web文書に含まれるタグに基づいて、項目、属性及び属性値の関係を有する情報を抽出することにより、項目に関する情報をWeb文書から自動的に収集する。【解決手段】情報収集装置1は、通信ネットワークNを介してアクセス可能なWeb文書から、Web文書に含まれるタグに基づいて表形式あるいはデータベース形式の情報を抽出する情報群抽出手段12と、抽出した表形式あるいはデータベース形式の情報から、前記タグが示す各情報間の従属関係に基づいて、所定の項目に対して従属する関係にある属性及び前記属性の内容を示す属性値の関係を有する情報を抽出し、抽出した前記項目、属性及び属性値の関係を有する情報を関連付けて記憶手段に記憶する属性関係抽出手段13と、を備える。【選択図】図2
Claim (excerpt):
情報収集装置が、通信ネットワークを介してアクセス可能なWeb文書から、前記Web文書に含まれるタグに基づいて表形式あるいはデータベース形式の情報を抽出するステップと、
抽出した前記表形式あるいはデータベース形式の情報から、前記タグが示す各情報間の従属関係に基づいて、所定の項目に対して従属する関係にある属性及び前記属性の内容を示す属性値の関係を有する情報を抽出するステップと、
抽出した前記項目、属性及び属性値の関係を有する情報を関連付けて記憶手段に記憶するステップと、を少なくとも実行することを特徴とする情報収集方法。
IPC (1):
FI (1):
F-Term (4):
5B075NK24
, 5B075NK31
, 5B075NR02
, 5B075NR05
Patent cited by the Patent: