特許
J-GLOBAL ID:200903001949477055
情報収集システム、アプリケーションサーバ、情報収集方法、およびプログラム
発明者:
,
,
,
出願人/特許権者:
代理人 (3件):
坂口 博
, 市位 嘉宏
, 上野 剛史
公報種別:公開公報
出願番号(国際出願番号):特願2002-218740
公開番号(公開出願番号):特開2004-062446
出願日: 2002年07月26日
公開日(公表日): 2004年02月26日
要約:
【課題】例えばWeb上に公開されている様々な領域のカタログ等を、自動的に切り出す。【解決手段】ユーザの興味に関する情報を受信するユーザ要求受信部31と、受信した情報に基づいて、複数のサイトからHTML文書を取得するHTML取得部32と、取得したHTML文書に対して切り出し処理を施すための切り出しルールを提供する切り出しルール処理機構41と、受信した情報に基づいてオントロジを読み出し、語彙情報を得る語彙情報処理機構42と、公理ルールに基づいて推論演算を実行する推論処理機構43と、取得したHTML文書に対し、切り出しルール処理機構41の切り出しルール、語彙情報処理機構42からの語彙情報、推論処理機構43の推論演算に基づき、HTML文書のタグを頼りに抽出データオブジェクトを取り出す抽出位置情報特定部33とを含む。【選択図】 図2
請求項(抜粋):
複数のデータファイルをネットワークを介して取得する取得手段と、
前記取得手段により取得された複数のデータファイルに対し、所定の切り出しルールと用語の関係記述であるオントロジとを利用して解析する解析手段と、
前記解析手段による解析に基づいて、前記複数のデータファイルから必要な情報を抽出する抽出手段と
を含む情報収集システム。
IPC (3件):
G06F17/30
, G06F13/00
, G06F17/60
FI (5件):
G06F17/30 220A
, G06F17/30 110F
, G06F17/30 340A
, G06F13/00 540A
, G06F17/60 328
Fターム (9件):
5B075KK07
, 5B075ND20
, 5B075NS01
, 5B075NS10
, 5B075PP28
, 5B075PQ02
, 5B075PQ20
, 5B075PR08
, 5B075UU40
引用特許:
前のページに戻る