特許
J-GLOBAL ID:200903053037524087

文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム

発明者:
出願人/特許権者:
代理人 (1件): 田澤 博昭 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平7-068160
公開番号(公開出願番号):特開平8-263514
出願日: 1995年03月27日
公開日(公表日): 1996年10月11日
要約:
【要約】【目的】 検索キーワードが容易に得られ、ボトムアップ型の発送支援システムとして機能する情報検索システムを得る。【構成】 検索条件入力部3からの検索条件に従って情報検索部2が文書データベース1より検索した文書集合を格納する検索結果格納部9、その文書集合を対象に文書を自動分類する自動分類部10、自動分類された文書集合の情報空間を視覚化する情報空間可視化部11、視覚化された2次元の位置を指定することにより自動分類された文書の呼び出しを行い、それが複数ある場合にはその中より1つを選択する文書選択部12、および選択された文書の内容を検索結果格納部より取り出して表示する文書内容表示部13を設けたもの。
請求項(抜粋):
文書集合が与えられた時、その文書集合中の各文書を、その内容に応じて自動的に分類する文書の自動分類方法において、前記文書集合に含まれる、単語や句、節などの意味のある文字列による語句の中から、一定の条件で選んだ語句を構成要素として、文書集合中のある文書を、それが含む語句に対応する値をその語句の出現頻度をもとに定めた語句ベクトルとして表現し、前記文書の語句ベクトルと2次元に配置されたセルに対応する語句ベクトルの距離を計算して、その距離が最小のものをその文書が所属する仮のセルとし、当該セルの語句ベクトルの要素の値をその文書の語句ベクトルの要素の値に近付けるとともに、そのセルの近傍のセルの語句ベクトルの要素の値も、その文書の語句ベクトルに対する近傍の度合いに応じて減じて近付けることを、前記文書集合に含まれる文書について一定回数、もしくは収束するまで実行し、その後、各セルの語句ベクトルと文書の語句ベクトルとの距離を計算して、その距離が最小のセルをその文書が所属する本来のセルとして、同じセルに所属する文書を内容が類似した文書のクラスタと判断することを特徴とする文書の自動分類方法。
IPC (2件):
G06F 17/30 ,  G06F 7/24
FI (4件):
G06F 15/403 350 Z ,  G06F 7/24 L ,  G06F 15/403 340 B ,  G06F 15/403 350 C

前のページに戻る