特許
J-GLOBAL ID:200903080104838404
Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体
発明者:
,
,
出願人/特許権者:
代理人 (2件):
秋田 収喜
, 近野 恵一
公報種別:公開公報
出願番号(国際出願番号):特願2003-021457
公開番号(公開出願番号):特開2004-234288
出願日: 2003年01月30日
公開日(公表日): 2004年08月19日
要約:
【課題】Webページに含まれている地理情報と時間情報に基づき、時空間構造に基づくWebページ検索方法を実現することを目的とする。【解決手段】インターネット上のWebページを収集し、収集したWebページから時空間情報を抽出し、その時空間情報に基づきWeb情報を構造化したデータベースを作成し、そのデータベースに対する地理条件及び時間条件の指定により、上記目的の検索処理を実現する。このうち、データベースがインターネット上に発信されているWeb情報を網羅するために、Webロボットを用いて大量のWebページを収集し、Webページの形式に応じて場合分け(1.メタ情報が記述されていないHTML文書、2.メタ情報が記述されているHTML文書、3.XML形式の文書、XMLデータベースおよび出力形式がXMLであるWebサービス)を行い、それぞれWeb情報から時空間情報を抽出する。【選択図】 図3
請求項(抜粋):
インターネット上のWeb情報を検索する方法において、
インターネット上のWeb情報を取得するステップと、
取得したWeb情報からメタ情報のないHTML文書を選択するステップと、
HTML文書中のHTMLタグの除去と形態素解析を行うステップと、
HTML文書中の固有名詞のうち地名、住所、建物名、組織名、および個人名と、地理情報データベースを比較してHTML文書の地理属性を特定するステップと、
HTML文書中に数値で記述されている部分とその前後の記述と時間情報の出現パターンを比較してHTML文書の時間属性を特定するステップと、
対象となっているHTML文書を時空間属性により構造化してデータベースへ登録するステップと、
検索インタフェースから地理条件及び時間条件を指定してそのデータベースの検索を行うステップと、
指定した条件に合致する検索結果を返すステップ
を備えるWeb検索方法。
IPC (1件):
FI (5件):
G06F17/30 230Z
, G06F17/30 110F
, G06F17/30 140
, G06F17/30 330C
, G06F17/30 360Z
Fターム (7件):
5B075ND34
, 5B075NK02
, 5B075NK46
, 5B075NR01
, 5B075PP24
, 5B075PQ02
, 5B075PQ13
引用特許:
前のページに戻る