特許
J-GLOBAL ID:200903025026273585

文書データ分類装置及び文書分類機能構築装置

発明者:
出願人/特許権者:
代理人 (1件): 森田 寛 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-131211
公開番号(公開出願番号):特開平5-324726
出願日: 1992年05月25日
公開日(公表日): 1993年12月07日
要約:
【要約】【目的】本発明は、文書データが与えられるときに、その文書データの属する分類クラスを特定する文書データ分類装置と、その文書データ分類装置の自動構築を実現する文書分類機能構築装置に関する。【構成】キーワードが割り付けられるとともに、キーワードを含む場合の分岐先と、含まない場合の分岐先とが異なるものとなるノードの木構造により構成され、かつ葉ノードには、キーワードに代えて分類クラスが割り付けられるよう構成される分類決定木10を用意して、この分類決定木10を辿ることで文書データの属する分類クラスを特定する構成を採り、一方、サンプルの文書データから文字列のキーワードを抽出し、未割付のキーワードの持つ文書データに対しての評価値に従ってノードにキーワードを割り付けていって、葉ノードには、それまでに振り分けられた文書データの持つ分類クラスを割り付けていく構成を採る。
請求項(抜粋):
文書データが与えられるときに、該文書データの属する分類クラスを特定する文書データ分類装置であって、キーワードが割り付けられるとともに、該キーワードを含む場合の分岐先と、含まない場合の分岐先とが異なるものとなるノードの木構造により構成され、かつ、葉ノードには、キーワードに代えて分類クラスが割り付けられるよう構成される分類決定木(10)を用意して、文書データが与えられるときに、上記分類決定木(10)を辿ることで、該文書データの属する分類クラスを特定するよう構成されることを、特徴とする文書データ分類装置。

前のページに戻る