特許
J-GLOBAL ID:200903046686859385

テキスト自動分類方法及び装置並びにプログラム及び記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 古谷 史旺
公報種別:公開公報
出願番号(国際出願番号):特願2002-373868
公開番号(公開出願番号):特開2004-206355
出願日: 2002年12月25日
公開日(公表日): 2004年07月22日
要約:
【課題】本発明は分類精度を改善することが可能なテキスト自動分類方法及び装置並びにプログラム及び記録媒体を提供することを目的とする。【解決手段】文字列情報で構成されるテキストを処理対象とし、互いに独立した複数のN個のテキストを入力して、各テキストをテキスト間の類似性に基づいてNよりも小さい数のグループに分類するためのテキスト自動分類方法において、入力されるN個のテキストにクラスター分析処理を適用して分類する過程で、最も類似する2つのクラスターをクラスター組として検出した場合に、前記クラスター組の各クラスターを構成する複数の要素について、クラスター間で要素同士の類似度を求め、前記要素同士の類似度を所定の閾値と比較し、前記比較の結果が所定の条件を満たさない場合には、クラスター間の類似性判断対象から前記クラスター組を除外する。【選択図】 図1
請求項(抜粋):
文字列情報で構成されるテキストを処理対象とし、互いに独立した複数のN個のテキストを入力して、各テキストをテキスト間の類似性に基づいてNよりも小さい数のグループに分類するためのテキスト自動分類方法において、 入力されるN個のテキストにクラスター分析処理を適用して分類する過程で、最も類似する2つのクラスターをクラスター組として検出した場合に、 前記クラスター組の各クラスターを構成する複数の要素について、クラスター間で要素同士の類似度を求め、 前記要素同士の類似度を所定の閾値と比較し、 前記比較の結果が所定の条件を満たさない場合には、クラスター間の類似性判断対象から前記クラスター組を除外する ことを特徴とするテキスト自動分類方法。
IPC (1件):
G06F17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 350C
Fターム (5件):
5B075ND03 ,  5B075NR12 ,  5B075PR06 ,  5B075QS01 ,  5B075UU06
引用特許:
出願人引用 (3件) 審査官引用 (1件)

前のページに戻る