特許
J-GLOBAL ID:200903082653487381

文書の自動分類方法およびその装置

発明者:
出願人/特許権者:
代理人 (1件): 宮田 金雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-328370
公開番号(公開出願番号):特開平10-171823
出願日: 1996年12月09日
公開日(公表日): 1998年06月26日
要約:
【要約】【課題】 文書を意味的な内容の遠近に応じて一定の次元の空間に高速に配置する。【解決手段】 ベクトル化手段103によってベクトル化した文書に対して、まずクラスタリング手段104によって適当な数のベクトルをまとめ、次にクラスタ中心抽出手段105によって各々のクラスタを代表する点を抽出し、それらクラスタ中心に対してのみマッピング手段106を適用し、クラスタリング手段104とマッピング手段106の結果からクラスタ展開手段107により各クラスタに含まれるベクトルの配置場所を決定する。
請求項(抜粋):
分類の対象となる文書から内容を表現するような意味要素を抽出する第1ステップ、上記文書における意味要素の強さを数値化し、上記文書を数値のベクトルとして表現する第2ステップ、ベクトル化した上記文書を複数のクラスタに分類する第3ステップ、各々のクラスタを代表するベクトルをクラスタ中心として抽出する第4ステップ、各クラスタ中心をその意味内容の遠近を反映するように一定の次元の空間に配置する第5ステップ、および各クラスタに含まれる文書の配置場所を、第3ステップによる分類結果と各クラスタ中心の配置場所とをもとに決定する第6ステップを実行する文書の自動分類方法。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (2件):
G06F 15/401 310 D ,  G06F 15/38 M

前のページに戻る