特許
J-GLOBAL ID:200903043406502399

テキストファイルの自動分類方法

発明者:
出願人/特許権者:
代理人 (1件): 大垣 孝
公報種別:公開公報
出願番号(国際出願番号):特願平7-026880
公開番号(公開出願番号):特開平8-221439
出願日: 1995年02月15日
公開日(公表日): 1996年08月30日
要約:
【要約】【目的】 テキストファイルの特徴ベクトルを生成しこれをニューラルネットワークの入力層に入力して該ネットワークの結合リンクを特徴ベクトルに適合するように修正する学習をし、その後、分類対象であるテキストファイルを分類する方法であって従来より処理時間の短い方法を提供する。【構成】 予め複数の基本単語を用意する。テキストファイルから単語を抽出し該抽出される単語群における基本単語に当たる単語の出現回数を基本単語ごとに計数した結果に基づいて、特徴ベクトルを生成する。結合リンクの修正は、学習前の出力層に用意されている出力ノードのうち前記特徴ベクトルに対する距離が最も近い出力ノードを決定し、その距離に応じて、その出力ノードの特徴ベクトルに対する距離が近づくよう結合リンクを修正する処理または、新たな出力ノードを追加生成する処理のいずれかを実施することにより行なう。
請求項(抜粋):
テキストファイルからその特徴ベクトルを生成し、該特徴ベクトルを入力層、出力層および結合リンクを具えるニューラルネットワークの当該入力層に入力し、前記結合リンクを前記入力された特徴ベクトルに適合するように修正する学習をし、その後、分類対象であるテキストファイルからその特徴ベクトルを生成し、該特徴ベクトルを前記学習後のニューラルネットワークの入力層に入力し、該学習後のニュラルネットワークの出力層における前記特徴ベクトルに対する距離が近い出力ノードを勝者ノードとして該勝者ノードを前記分類対象であるテキストファイルの分類先とする、テキストファイルの自動分類方法において、少なくとも前記学習段階における特徴ベクトルは、予め複数の基本単語を用意しておき、一方、前記テキストファイルから単語を抽出し、該抽出される単語群における前記基本単語に当たる単語の出現回数を基本単語ごとに計数した結果に基づいて、生成し、結合リンクの前記修正は、学習前の出力層に用意されている出力ノードのうち前記生成された特徴ベクトルに対する距離が最も近い出力ノードを決定し、該決定された出力ノードの前記特徴ベクトルに対する距離に応じて、(a)少なくとも該決定された出力ノードの前記特徴ベクトルに対する距離が近づくよう前記結合リンクを修正する処理または、(b)新たな出力ノードを追加生成する処理のいずれかを実施することにより行なうことを特徴とするテキストファイルの自動分類方法。
IPC (2件):
G06F 17/30 ,  G06F 15/18 540
FI (4件):
G06F 15/401 310 D ,  G06F 15/18 540 Z ,  G06F 15/40 370 A ,  G06F 15/403 350 C

前のページに戻る