特許
J-GLOBAL ID:200903039439769466

文書分類装置ならびに文書分類装置の分類体系生成装置および方法

発明者:
出願人/特許権者:
代理人 (3件): 澤田 俊夫 ,  宮田 正昭 ,  山田 英治
公報種別:公開公報
出願番号(国際出願番号):特願2004-073973
公開番号(公開出願番号):特開2005-266866
出願日: 2004年03月16日
公開日(公表日): 2005年09月29日
要約:
【課題】 フラットな分類枠から階層化構造の分類体系を自動的に構築する。 【解決手段】 サンプル文書入力部141はサンプル文書記憶部13から分類枠に関係づけられたサンプル文書を受取り初期分類体系生成部142に供給する(S10)。初期分類体系生成部142はサンプル文書を参照して分類枠をクラスタリングし、クラスタを上位分類枠としクラスタの属する分類枠を末端分類枠として初期分類体系を生成して分類体系記憶部143に記憶する(S11)。評価部144は、分類体系記憶部143に記憶されている暫定的な分類体系を参照してサンプル文書を自動分類し(S12)、この後分類結果を評価する(S13)。精度が基準値より低い上位分類枠がある場合には、分類体系変更部145が分類体系を変更する。精度が基準値より低い上位分類枠に対応するクラスタとこのクラスタに類似するクラスタ等を1つのクラスタに統合して再クラスタリングを行い、クラスタを生成して分類体系を変更する(S15)。【選択図】 図3
請求項(抜粋):
文書分類装置の階層構造分類体系を生成する分類体系生成装置において、 非階層構造の末端分類枠ごとのサンプル文書を入力し、上記サンプル文書を参照して非階層型の末端分類枠をクラスタリングし、クラスタリングの結果得られたクラスタを上位分類枠として上記非階層型の末端分類枠の上位に配置する階層構造を、初期の階層構造分類体系として生成する初期階層構造分類体系生成手段と、 初期の階層構造分類体系または変更された階層構造分類体系を記憶する階層構造分類体系記憶手段と、 上記階層構造分類体系記憶手段に記憶されている階層構造分類体系を参照して上記サンプル文書を分類し、分類精度が基準値より低い上位分類枠を判別する分類精度評価手段と、 分類精度が基準値より低い上位分類枠が判別されたときに、上記分類精度評価手段により精度が基準値より低いと評価された上位分類枠のクラスタを、他のクラスタと統合して1つのクラスタに再編し、統合した上記1つのクラスタに含まれる末端分類枠を、当該末端分類枠に含まれる上記サンプル文書を参照して再クラスタリングし、再クラスタリングの結果得られたクラスタを、当該1つのクラスタに対応する上位分類枠の下位の上位分類枠とするように、上記階層構造分類体系記憶手段に記憶されている上記階層構造分類体系を変更する階層構造変更手段とを有し、 所定の終了条件が満たされないときは、上記分類結果評価手段による判別と上記階層構造変更手段による上記階層構造分類体系の変更とを繰り返し、所定の終了条件が満たされたときに上記階層構造分類体系記憶手段に記憶されている上記階層構造分類体系を上記文書分類装置の分類体系として用いることを特徴とする分類体系生成装置。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 414A
Fターム (6件):
5B075ND03 ,  5B075NK43 ,  5B075NR12 ,  5B075PP24 ,  5B075QP01 ,  5B075UU06
引用特許:
出願人引用 (6件)
全件表示
審査官引用 (5件)
全件表示

前のページに戻る