特許
J-GLOBAL ID:200903057794076801
情報監視装置
発明者:
,
,
,
出願人/特許権者:
代理人 (2件):
田澤 博昭
, 加藤 公延
公報種別:公開公報
出願番号(国際出願番号):特願2003-072311
公開番号(公開出願番号):特開2004-280569
出願日: 2003年03月17日
公開日(公表日): 2004年10月07日
要約:
【課題】調査目的に合致した情報を多く含むサイトを効率的に抽出する。【解決手段】インターネット上からWeb文書を多数取得し、それらの文書が属するサイトURLを取得し、該サイトURL毎に文書に含まれる風評表現の出現頻度、および文書の内容的特徴を表すサイト特徴を算出し、サイト管理テーブルに記憶する。システム利用者が入力した検索条件を基に得られたWeb文書について、上記と同様の方法でサイトURL毎のサイト特徴を算出し、システム利用者が指定したサイトの特徴リストに含まれるサイト特徴と類似するサイトを目的のサイトとして出力する。【選択図】 図1
請求項(抜粋):
インターネット上の文書から、Web文書を巡回収集し、収集された文書と文書URLを出力するクローラ部と、
上記クローラ部で収集された各文書から、予め設定された風評表現を抽出し、抽出された風評表現に対応する評価値に基づいて各文書の風評度を算出して出力する第1の風評度算出部と、
上記クローラ部で出力された文書URLから、各文書の属するサイトURLを抽出する第1のサイト抽出部と、
上記サイトURLで指定されるサイトの内容的特徴を表すサイト特徴を出力し、サイトURLとサイト特徴を対応付けてサイト管理テーブルに記憶する第1のサイト特徴算出部と、
上記サイト管理テーブルから、システム利用者により指定されたサイトURLのサイト特徴Bを抽出するサイト選択部と、
入力された検索条件を基にインターネット上の文書を検索し、検索結果として文書URLおよび更新日時を含む文書情報を出力する文書検索部と、
文書URL毎の文書情報を記憶するURL管理テーブルを参照し、上記文書検索部により出力された文書URLのうち、上記URL管理テーブルに登録されていない文書URLおよび文書情報が更新されている文書URLを新規URLとして出力し、上記URL管理テーブルに該新規URLの文書情報を登録する新規URL抽出部と、
上記新規URLの文書をインターネット上から取得するダウンロード部と、
上記ダウンロード部で取得された各文書から、予め設定された風評表現を抽出し、抽出された風評表現に対応する評価値に基づいて各文書の風評度を算出して出力する第2の風評度算出部と、
上記新規URLから、各文書の属する新規サイトURLを抽出する第2のサイト抽出部と、
上記新規サイトURLで指定されるサイトの内容的特徴を表すサイト特徴Aを出力する第2のサイト特徴算出部と、
上記サイト特徴Aと上記サイト特徴Bの類似度を算出し、類似度が一定値以上の新規サイトURLを出力すると共に、当該新規サイトURLの文書情報をサイト管理テーブルに記録する類似サイト抽出部とを備えた情報監視装置。
IPC (2件):
FI (6件):
G06F17/30 180Z
, G06F17/30 170A
, G06F17/30 350C
, G06F17/30 419B
, G06F17/60 150
, G06F17/60 504
Fターム (17件):
5B075KK02
, 5B075KK34
, 5B075KK35
, 5B075ND03
, 5B075ND36
, 5B075NK32
, 5B075NR02
, 5B075NR12
, 5B075NS10
, 5B075PQ02
, 5B075PQ75
, 5B075PR06
, 5B075PR08
, 5B075QM05
, 5B075QP01
, 5B075QS01
, 5B075UU06
前のページに戻る