特許
J-GLOBAL ID:201103015592340985 ラベル表示型文書検索装置、ラベル表示型文書検索方法、ラベル表示型文書検索方法を実行させるコンピュータプログラム並びにこのコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体
発明者:
,
出願人/特許権者: 代理人 (1件):
三好 秀和
公報種別:特許公報
出願番号(国際出願番号):特願2004-013398
公開番号(公開出願番号):特開2005-208838
特許番号:特許第4146361号
出願日: 2004年01月21日
公開日(公表日): 2005年08月04日
請求項(抜粋):
【請求項1】文字列からなる本文を含む文書であって当該文書の題名と当該文書を示す文書識別情報をさらに含み且つ予め定めた文字列である属性値が当該本文に含まれる文書が複数記憶された文書記憶手段と、
前記文書記憶手段に記憶された各文書に対応する文書ベクトルであって、当該文書に含まれる属性値の数を属性値ごとに含む文書ベクトルを生成する文書ベクトル生成手段と、
前記文書記憶手段に記憶された複数の文書のいずれかに少なくとも含まれた属性値ごとに該属性値の当該複数の文書での出現回数を記録した統計情報を生成し、予め設けた記憶手段に記憶させる統計処理手段と、
前記文書記憶手段から複数の文書を検索する文書検索手段と、
この検索された複数の文書のいずれかに少なくとも含まれた属性値ごとに該属性値の当該複数の文書での出現回数を記録した検索結果統計情報を生成し記憶する検索結果統計情報生成手段と、
前記検索された複数の文書のいずれかに少なくとも含まれた属性値ごとに、該属性値が当該複数の文書の一部をなす複数の文書を表す文字列であるラベルとして適している程度を示す適合度を算出するための、当該属性値の前記統計情報および前記検索結果統計情報での各出現回数を用いた算出式を使用して、当該属性値の適合度を算出する適合度算出手段と、
前記検索された複数の文書のいずれかに少なくとも含まれた属性値からなる複数の属性値のそれぞれに対応する前記適合度の高い方から当該適合度が予め設定された条件を満たす限り当該適合度に対応する属性値を選択することにより、当該複数の属性値の一部をなす複数の属性値を選択し、選択された複数の属性値をそれぞれラベルとし、当該複数のラベルを含むラベル情報を生成するラベル情報生成手段と、
前記ラベル情報に含まれたラベルごとに、該ラベルである文字列を含む文書であり且つ前記検索された複数の文書のいずれかでもある文書を示す文書識別情報および題名を当該文書の数だけ含むクラスタ情報であり且つ当該ラベルを含むクラスタ情報を生成するクラスタ情報生成手段と、
前記クラスタ情報ごとに、該クラスタ情報に含まれた文書識別情報を含む複数の文書のそれぞれに対応する前記文書ベクトルのベクトル和であるクラスタベクトルを生成し、当該クラスタ情報に含まれた文書識別情報でない文書識別情報を含む文書であり且つ前記文書記憶手段に記憶された文書に対応する文書ベクトルと当該クラスタベクトルとの余弦尺度を算出し、当該余弦尺度が、予め設定したしきい値を超えているなら、当該クラスタ情報に当該文書の文書識別情報および題名を含ませるクラスタ情報変更手段と、
前記ラベル情報に含まれた各ラベルを表示させ、1つの当該ラベルが選択されて当該ラベルを含むクラスタ情報に含まれた文書識別情報および題名の組がそれぞれ表示され、1つの当該文書識別情報および題名の組が選択されたなら、当該文書識別情報および題名の組を含む文書を前記文書記憶手段から読み出して表示させる文書表示制御手段と
を備えることを特徴とするラベル表示型文書検索装置。
IPC (1件): FI (3件):
G06F 17/30 170 A
, G06F 17/30 210 D
, G06F 17/30 350 C
引用特許: 引用文献: 前のページに戻る