特許
J-GLOBAL ID:201103005979386538
ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体
発明者:
,
出願人/特許権者:
代理人 (1件):
三好 秀和
公報種別:特許公報
出願番号(国際出願番号):特願2004-156296
公開番号(公開出願番号):特開2005-339139
特許番号:特許第4146393号
出願日: 2004年05月26日
公開日(公表日): 2005年12月08日
請求項(抜粋):
【請求項1】文字列からなる本文を含む文書であって当該文書の題名と当該文書を示す文書識別情報をさらに含み且つ予め定めた文字列である属性値が当該本文に含まれる文書が複数記憶された文書記憶手段と、
前記文書記憶手段に記憶された複数の文書のいずれかに少なくとも含まれた属性値ごとに該属性値の当該複数の文書での出現回数を記録した統計情報を生成し、予め設けた記憶手段に記憶させる統計処理手段と、
前記文書記憶手段から複数の文書を検索する文書検索手段と、
この検索された複数の文書のいずれかに少なくとも含まれた属性値ごとに該属性値の当該複数の文書での出現回数を記録した検索結果統計情報を生成し記憶する検索結果統計情報生成手段と、
前記検索された複数の文書のいずれかに少なくとも含まれた属性値ごとに、該属性値が当該複数の文書の一部をなす複数の文書を表す文字列であるラベルとして適している程度を示す適合度を算出するための、当該属性値の前記統計情報および前記検索結果統計情報での各出現回数を用いた算出式を使用して、当該属性値の適合度を算出する適合度算出手段と、
前記検索された複数の文書のいずれかに少なくとも含まれた属性値からなる複数の属性値のそれぞれに対応する前記適合度の高い方から当該適合度が予め設定された条件を満たす限り当該適合度に対応する属性値を選択することにより、当該複数の属性値の一部をなす複数の属性値を選択し、選択された複数の属性値をそれぞれラベルとし、当該複数のラベルを含むラベル情報を生成するラベル情報生成手段と、
前記ラベル情報に含まれたラベルごとに、該ラベルである文字列を含む文書であり且つ前記検索された複数の文書のいずれかでもある文書を示す文書識別情報および題名を当該文書の数だけ含むクラスタ情報であり且つ当該ラベルを含むクラスタ情報を生成するクラスタ情報生成手段と、
前記ラベル情報に含まれた2つのラベルごとに、該一方のラベルを含む前記クラスタ情報内の各文書識別情報で示される文書の集合である一方の集合と、当該他方のラベルを含む前記クラスタ情報内の文書識別情報で示される文書の集合である他方の集合との和集合に対する前記一方の集合の比率である第1比率と、当該和集合に対する前記他方の集合の比率である第2比率とを算出し、当該第1比率と当該第2比率がともに予め設定されたしきい値を超えているなら当該2つのラベルが同値関係にあると判定し、一方だけが予め設定されたしきい値を超えているなら、当該一方に対応するラベルが他方に対応するラベルに包含されるという包含関係があると判定し、同値関係または包含関係にあると判定したなら、当該2つラベルを含むラベルであり且つ当該2つのラベルの間の同値関係または包含関係がわかるようなラベルを前記ラベル情報に含ませるとともに、当該2つのクラスタ情報のいずれかに少なくとも含まれた文書識別情報と題名の組を含むクラスタ情報であり且つ当該ラベルを含むクラスタ情報を生成する第2のクラスタ情報生成手段と、
前記ラベル情報に含まれた各ラベルを表示させ、1つの当該ラベルが選択されて当該ラベルを含むクラスタ情報に含まれた文書識別情報および題名の組がそれぞれ表示され、1つの当該文書識別情報および題名の組が選択されたなら、当該文書識別情報および題名の組を含む文書を前記文書記憶手段から読み出して表示させる文書表示制御手段と
を備えることを特徴とするラベル表示型文書検索装置。
IPC (1件):
FI (3件):
G06F 17/30 360 Z
, G06F 17/30 210 A
, G06F 17/30 170 A
引用特許:
引用文献:
前のページに戻る