特許
J-GLOBAL ID:201403078677300080

文書群検出方法及び文書群検出装置

発明者:
出願人/特許権者:
代理人 (1件): 服部 毅巖
公報種別:特許公報
出願番号(国際出願番号):特願2008-317790
公開番号(公開出願番号):特開2010-140373
特許番号:特許第5396845号
出願日: 2008年12月15日
公開日(公表日): 2010年06月24日
請求項(抜粋):
【請求項1】 ネットワーク上で提供される文書の集合から、記憶装置を有するコンピュータが、特定文書の配下に複数の配下文書が存在する階層構造を成す文書群を対象にして、特定のキーワードを用いて該配下文書のいずれかを検索し、検索された該配下文書に基づいて前記特定文書を検出し、該特定文書の配下の複数の配下文書を収集して前記記憶装置に格納し、 収集された前記文書群の前記特定文書及び複数の配下文書それぞれについて、前記コンピュータが、配下文書内の任意の文字列に付加される特定の他文書との関連を示す連結情報及び当該文字列を抽出して、当該連結情報及び当該文字列を対応付けて前記記憶装置に記録し、該配下文書と、関連付けられた連結先文書とで特定の関係となる状態数を集計し、集計した前記状態数が前記特定の関係を用いた条件である特徴ルールの条件を満たしている文書群の情報を対象文書群候補の情報として前記記憶装置に記録する、 文書群検出方法。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (3件):
G06F 17/30 419 A ,  G06F 17/30 170 J ,  G06F 17/30 140
引用特許:
審査官引用 (3件)
引用文献:
前のページに戻る