特許
J-GLOBAL ID:200903042005084733

文書分類装置

発明者:
出願人/特許権者:
代理人 (1件): 南野 貞男 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-199543
公開番号(公開出願番号):特開平10-027125
出願日: 1996年07月11日
公開日(公表日): 1998年01月27日
要約:
【要約】【課題】 ハイパーテキストのような複雑にリンク付けされた多数の文書を適切に分類することができる文書分類装置を提供する。【解決手段】 文書分類装置は、電子化された複数の文書を格納する文書格納手段と、前記文書格納手段に格納された複数の文書の間のリンク関係を格納するリンク関係格納手段と、前記文書格納手段に格納された各文書に含まれる単語の出現頻度から文書間距離を計算する距離計算手段と、前記リンク関係格納手段に格納されたリンク関係と前記距離計算手段から得られる文書間距離を基にして、初期文書クラスターを生成し、文書間距離に基づいたクラスター分析を行い、前記文書格納手段に格納された複数の文書を分類する文書分類手段と、文書分類手段による分類された結果を出力する出力手段とを備える。
請求項(抜粋):
電子化された複数の文書を格納する文書格納手段と、前記文書格納手段に格納された複数の文書の間のリンク関係を格納するリンク関係格納手段と、前記文書格納手段に格納された各文書に含まれる単語の出現頻度から文書間距離を計算する距離計算手段と、前記リンク関係格納手段に格納されたリンク関係と前記距離計算手段から得られる文書間距離を基にして、初期文書クラスターを生成し、文書間距離に基づいたクラスター分析を行い、前記文書格納手段に格納された複数の文書を分類する文書分類手段と、文書分類手段による分類された結果を出力する出力手段とを有することを特徴とする文書分類装置。
IPC (4件):
G06F 12/00 547 ,  G06F 12/00 510 ,  G06F 17/27 ,  G06F 17/30
FI (5件):
G06F 12/00 547 H ,  G06F 12/00 510 A ,  G06F 15/20 550 F ,  G06F 15/40 370 A ,  G06F 15/401 310 D

前のページに戻る