特許
J-GLOBAL ID:201703000972575036

文書分類装置

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人 志賀国際特許事務所
公報種別:特許公報
出願番号(国際出願番号):特願2013-188860
公開番号(公開出願番号):特開2015-056020
特許番号:特許第6173848号
出願日: 2013年09月11日
公開日(公表日): 2015年03月23日
請求項(抜粋):
【請求項1】 文書データを記憶する文書記憶部と、 カテゴリの階層構造と、前記文書データを前記カテゴリへ分類する際の分類ルールとを記憶するカテゴリ記憶部と、 分類の観点とするカテゴリと分類対象のカテゴリである対象カテゴリとの入力を受け、前記カテゴリ記憶部から分類の観点とする前記カテゴリの下位のカテゴリである軸カテゴリの集合を軸カテゴリ集合として読み出すカテゴリ操作部と、 前記文書記憶部に記憶されている文書データのうち、前記対象カテゴリの前記分類ルールを満たす前記文書データの集合を対象文書データ集合とし、前記対象文書データ集合に含まれる単語の特徴度を算出する特徴度算出部と、 前記特徴度算出部が算出した前記特徴度に基づいて文書の特徴を表す前記単語を選択し、選択した前記単語それぞれについて、前記軸カテゴリ集合中の各軸カテゴリの前記分類ルールを満たす前記対象文書データ集合における前記単語の出現頻度に基づく統計量を算出し、前記統計量を当該軸カテゴリに対応する要素の値として設定した傾向ベクトルを生成する傾向ベクトル生成部と、 前記傾向ベクトル生成部が生成した前記傾向ベクトルの類似性に基づいて前記単語をクラスタリングするクラスタリング部と、 前記クラスタリング部によるクラスタリングの結果得られたクラスタごとに、前記対象カテゴリを上位のカテゴリとし、前記クラスタに属する単語をフィルタ語に用いた分類ルールを有する特徴語カテゴリを生成して前記カテゴリ記憶部に登録するカテゴリ生成処理部と、 前記軸カテゴリを第1軸の分類項目とし、前記特徴語カテゴリを第2軸の分類項目とした2軸マップの各セルに、前記文書記憶部に記憶されている前記文書データのうち、前記セルに対応した前記軸カテゴリの前記分類ルールと前記セルに対応した前記特徴語カテゴリの前記分類ルールとを満たす前記文書データの数を表す情報を表示させる2軸マップ表示部と、 を具備することを特徴とする文書分類装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (4件):
G06F 17/30 210 D ,  G06F 17/30 350 C ,  G06F 17/30 170 A ,  G06F 17/30 414 A
引用特許:
出願人引用 (5件)
全件表示

前のページに戻る