Pat
J-GLOBAL ID:200903080104838404
Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体
Inventor:
,
,
Applicant, Patent owner:
Agent (2):
秋田 収喜
, 近野 恵一
Gazette classification:公開公報
Application number (International application number):2003021457
Publication number (International publication number):2004234288
Application date: Jan. 30, 2003
Publication date: Aug. 19, 2004
Summary:
【課題】Webページに含まれている地理情報と時間情報に基づき、時空間構造に基づくWebページ検索方法を実現することを目的とする。【解決手段】インターネット上のWebページを収集し、収集したWebページから時空間情報を抽出し、その時空間情報に基づきWeb情報を構造化したデータベースを作成し、そのデータベースに対する地理条件及び時間条件の指定により、上記目的の検索処理を実現する。このうち、データベースがインターネット上に発信されているWeb情報を網羅するために、Webロボットを用いて大量のWebページを収集し、Webページの形式に応じて場合分け(1.メタ情報が記述されていないHTML文書、2.メタ情報が記述されているHTML文書、3.XML形式の文書、XMLデータベースおよび出力形式がXMLであるWebサービス)を行い、それぞれWeb情報から時空間情報を抽出する。【選択図】 図3
Claim (excerpt):
インターネット上のWeb情報を検索する方法において、
インターネット上のWeb情報を取得するステップと、
取得したWeb情報からメタ情報のないHTML文書を選択するステップと、
HTML文書中のHTMLタグの除去と形態素解析を行うステップと、
HTML文書中の固有名詞のうち地名、住所、建物名、組織名、および個人名と、地理情報データベースを比較してHTML文書の地理属性を特定するステップと、
HTML文書中に数値で記述されている部分とその前後の記述と時間情報の出現パターンを比較してHTML文書の時間属性を特定するステップと、
対象となっているHTML文書を時空間属性により構造化してデータベースへ登録するステップと、
検索インタフェースから地理条件及び時間条件を指定してそのデータベースの検索を行うステップと、
指定した条件に合致する検索結果を返すステップ
を備えるWeb検索方法。
IPC (1):
FI (5):
G06F17/30 230Z
, G06F17/30 110F
, G06F17/30 140
, G06F17/30 330C
, G06F17/30 360Z
F-Term (7):
5B075ND34
, 5B075NK02
, 5B075NK46
, 5B075NR01
, 5B075PP24
, 5B075PQ02
, 5B075PQ13
Patent cited by the Patent:
Cited by examiner (5)
-
Web検索装置
Gazette classification:公開公報
Application number:特願2001-099964
Applicant:東京電力株式会社, 株式会社平和情報センター
-
住所情報による異種データの結合処理方法および装置
Gazette classification:公開公報
Application number:特願平10-021617
Applicant:日本電信電話株式会社
-
日時決定装置、日時決定方法、ならびに、記録媒体
Gazette classification:公開公報
Application number:特願2001-012125
Applicant:株式会社ジャストシステム
Show all
Return to Previous Page