特許
J-GLOBAL ID:200903087558336920

文書分類方法、文書分類プログラム及び文書分類装置

発明者:
出願人/特許権者:
代理人 (3件): 長谷川 芳樹 ,  寺崎 史朗 ,  尾関 孝彰
公報種別:公開公報
出願番号(国際出願番号):特願2005-058100
公開番号(公開出願番号):特開2006-190235
出願日: 2005年03月02日
公開日(公表日): 2006年07月20日
要約:
【課題】 複数の分類対象文書内における類似度の関係を視覚で認識できるように示すことができる文書分類方法を提供する。【解決手段】 分類対象文書のうちの各2文書間の安定文書間距離を両文書が類似する程度に応じて算出し、分類対象文書から初期配置文書を選択して位置座標を初期設定する。各初期配置文書について、他の初期配置文書への離間ベクトルの長さと安定文書間距離との差及び離間ベクトルの方向に基づいて、他の初期配置文書から受ける文書間力ベクトルを算出するステップと、文書間力ベクトルに応じて次回処理時点における位置座標を算出するステップとを収束するまで繰り返し、仮決め位置座標を求める。その後、複数回に分けて配置文書を追加して仮決め位置座標の算出を行い、最後に全分類対象文書について収束するまで文書間力ベクトル算出ステップと位置座標更新ステップとを繰り返す。【選択図】 図11
請求項(抜粋):
複数の分類対象文書をそれぞれの内容に応じて分類する文書分類方法であって、 前記分類対象文書のうちの各2文書間の安定文書間距離を、両文書が類似する程度に応じて算出する第1のステップと、 前記分類対象文書から初期配置文書を選択する第2のステップと、 各前記初期配置文書が表示座標系上で当初配置される位置座標を算出する第3のステップと、 配置された前記初期配置文書のうちの各2文書間について、現処理時点における前記表示座標系上の一方の文書から他方の文書への離間ベクトルを算出し、各配置された前記初期配置文書について、前記離間ベクトルの長さと前記安定文書間距離との差及び前記離間ベクトルの方向に基づいて、他のある初期配置文書から受ける文書間力ベクトルを算出する第4のステップと、 各配置された前記初期配置文書について、他の各前記初期配置文書から受ける文書間力ベクトルを総和して総和文書間力ベクトルを算出する第5のステップと、 各配置された前記初期配置文書について、前記総和文書間力ベクトルに応じて次回処理時点における位置座標を算出する第6のステップと、 前記第4ないし6のステップの繰返処理の実行中に前記初期配置文書の位置座標の収束を判断し、当該繰返処理を終了させる第7のステップと、 前記分類対象文書から新たに前記表示座標系に組み入れる次期配置文書を選択する第8のステップと、 各前記次期配置文書が前記表示座標系において当初配置される位置座標を算出する第9のステップと、 新たに配置された前記次期配置文書について、既存の配置文書から受ける文書間力ベクトルを総和して総和文書間力ベクトルを算出する第10のステップと、 新たに配置された前記次期配置文書について、前記総和文書間力ベクトルに応じて次回処理時点における位置座標を算出する第11のステップと、 前記第10及び11のステップの繰返処理の実行中に前記次期配置文書の位置座標の収束を判断し、当該繰返処理を終了させる第12のステップとを備えることを特徴とする文書分類方法。
IPC (1件):
G06F 17/30
FI (1件):
G06F17/30 210D
Fターム (7件):
5B075NR12 ,  5B075PP02 ,  5B075PP03 ,  5B075PQ02 ,  5B075PQ13 ,  5B075PQ22 ,  5B075PQ49
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (3件)
  • 文書検索システム
    公報種別:公開公報   出願番号:特願平10-252185   出願人:株式会社日立製作所
  • クラスタリング装置
    公報種別:公開公報   出願番号:特願平7-083535   出願人:富士ゼロックス株式会社
  • 情報提示装置
    公報種別:公開公報   出願番号:特願平10-022115   出願人:富士通株式会社
引用文献:
前のページに戻る