特許
J-GLOBAL ID:200903036644374203
文書分類方法、文書分類装置
発明者:
,
出願人/特許権者:
代理人 (2件):
吉田 研二
, 石田 純
公報種別:公開公報
出願番号(国際出願番号):特願2003-424905
公開番号(公開出願番号):特開2005-182611
出願日: 2003年12月22日
公開日(公表日): 2005年07月07日
要約:
【課題】文書群をユーザが所望するグループに分類する。【解決手段】クラスタリング部8は、新たに分類する文書群を構成する各文書の特徴量を算出し、その求めた特徴量に基づき文書をクラスタ分けし、更に各クラスタの特徴量を算出すると共に名称を付ける。カテゴリ特徴量抽出部10は、既存の分類体系を構成する各カテゴリの特徴量を算出する。類似度算出部12は、クラスタとカテゴリの各特徴量に基づき各クラスタと各カテゴリとの類似度を算出する。グループ分類部14は、各クラスタの類似度が基準値以上のカテゴリが存在し、かつ当該クラスタ名がカテゴリ名と一致すれば、当該クラスタを当該カテゴリに振り分け、それ以外の場合はそのクラスタを分類するカテゴリを新たに作成する。【選択図】図1
請求項(抜粋):
複数の文書をユーザが所望するグループに分類する文書分類装置として、コンピュータシステムを機能させるためのプログラムであって、当該コンピュータを、
記憶手段に記憶された分類体系に基づいて新たに分類する文書群を、その文書群に含まれる各文書の特徴量に基づいてクラスタ分けすると共に、各クラスタの特徴量を当該クラスタに属する文書の特徴量に基づき算出するクラスタリング手段と、
前記分類体系を形成する各グループの特徴量と、前記クラスタリング手段により算出された各クラスタの特徴量とに基づき各グループと各クラスタとの類似度を求める類似度算出手段と、
前記類似度算出手段により求められた類似度と予め設定されている基準値との比較結果に基づいて、当該クラスタを既存のグループに振り分けるか、あるいは当該クラスタを分類する新たなグループを生成して前記分類体系に追加するかを決定する分類手段と、
して機能させることを特徴とするプログラム。
IPC (1件):
FI (3件):
G06F17/30 210D
, G06F17/30 170A
, G06F17/30 350C
Fターム (7件):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075PR04
, 5B075PR06
, 5B075QM05
, 5B075UU06
引用特許: