特許
J-GLOBAL ID:200903064152698406
XML文書の適合度の算出方法およびそのプログラムと、情報処理装置
発明者:
,
,
,
出願人/特許権者:
代理人 (2件):
磯野 道造
, 大石 恵
公報種別:公開公報
出願番号(国際出願番号):特願2006-333993
公開番号(公開出願番号):特開2008-146424
出願日: 2006年12月12日
公開日(公表日): 2008年06月26日
要約:
【課題】蓄積されたXML文書に対して、パスと検索単語を入力して適合度の算出を行う場合に、処理を高速に行うこと。【解決手段】本発明は、XML文書を複数蓄積し、それらのXML文書に対してパスと検索単語によってランキングを行う情報処理装置において、記憶部が、パス情報、ノード情報および単語情報を記憶している。また、パス情報は、パス単位の情報として、それぞれのパスの配下の部分文書の集合に関する統計情報であるパス統計情報を記憶している。 そして、処理部は、パスと検索単語が入力される前に、パス統計情報を含むパス情報を更新しておくので、適合度の算出時はパス統計情報を算出する必要がなく、検索を高速に処理することができる。【選択図】図1
請求項(抜粋):
複数のXML文書に関するパス単位の情報を格納するパス情報、前記XML文書ごとの各XML文書におけるノード間の関係情報を格納するノード情報、および、前記複数のXML文書で使用されている各単語の出現位置情報を格納する単語情報、を記憶する記憶部と、
前記複数のXML文書に関してパス単位の情報を前記パス情報に格納するパスインデックス部と、
それぞれの前記XML文書におけるノード間の親子関係を含む関係を分析しその関係情報を前記ノード情報に格納するノード管理部と、
前記複数のXML文書のいずれかで使用されている単語を、その単語が使用されているXML文書の文書ID(IDentification)を含む出現位置情報と関連付けて前記単語情報に格納するテキストインデックス部と、
パスと検索単語が入力されたときに、前記複数のXML文書に関して、その入力されたパスの配下の文書である部分文書における当該検索単語の適合度を算出するランキング部と、
を備える情報処理装置が、構造化データであるXML文書を複数蓄積し、その複数のXML文書に関して、前記入力されたパスの配下の部分文書における前記検索単語の適合度を算出する、XML文書の適合度の算出方法であって、
前記パス情報は、パス単位の情報として、それぞれのパスの配下の部分文書の集合に関する統計情報であるパス統計情報を記憶しており、
前記パスインデックス部は、前記パスと検索単語が入力される前に、蓄積された前記複数のXML文書に関して、前記パス統計情報を含むパス情報を更新し、
前記ランキング部は、前記パスと検索単語が入力された後に、前記パス統計情報を含むパス情報、前記ノード情報、および、前記単語情報を参照し、当該パスと検索単語に基づいて、前記複数のXML文書に関する適合度の算出を行う
ことを特徴とするXML文書の適合度の算出方法。
IPC (1件):
FI (3件):
G06F17/30 210Z
, G06F17/30 140
, G06F17/30 320Z
Fターム (6件):
5B075ND03
, 5B075ND35
, 5B075PP22
, 5B075PR04
, 5B075QS01
, 5B075UU06
引用特許:
引用文献:
前のページに戻る