特許
J-GLOBAL ID:200903062351531860

情報分類方式

発明者:
出願人/特許権者:
代理人 (1件): 上村 輝之
公報種別:公開公報
出願番号(国際出願番号):特願平11-067765
公開番号(公開出願番号):特開2000-268040
出願日: 1999年03月15日
公開日(公表日): 2000年09月29日
要約:
【要約】【課題】 分類する情報の内容、及び体裁の双方に着目して情報分類を行えるようにする。【解決手段】 文書管理サーバ1に提供されるサンプル文書には、テキスト文書、文書ファイル、文書イメージがある。各文書をメディア変換により書式付き文書に変換する。書式付き文書より内容的特徴及び体裁的特徴の抽出を行う。内容的特徴の抽出ではテキスト文書中に出現する単語の種類や出現頻度から重みを加えた単語の頻度ベクトルを生成させ、カテゴリの内容的特徴とする。体裁的特徴の抽出では頁内の共通属性領域情報を生成させ、カテゴリの体裁的特徴とする。内容的特徴及び体裁的特徴を再検証し、カテゴリが内容的特徴に依存するものか、体裁的特徴に依存するものかを決定付けるための特徴ベクトルを算出する。カテゴリ学習と同様、分類対象の文書のメディア変換を行い、書式付き文書に変換する。書式付き文書から内容的特徴及び体裁的特徴を抽出し、各カテゴリと各文書の内容的特徴、各カテゴリと各文書の体裁的特徴を夫々比較する。
請求項(抜粋):
任意のカテゴリに属する1又は複数の情報の特徴を学習することにより、前記カテゴリの特徴を定義する手段と、分類の対象として与えられた情報を解析することにより、その情報の特徴を抽出する手段と、前記定義されたカテゴリの特徴と、前記抽出された情報の特徴とに所定の処理を施すことにより、前記情報が前記カテゴリに属するか否か判定する手段と、を備える情報分類方式。
FI (2件):
G06F 15/401 310 D ,  G06F 15/403 340 B
Fターム (9件):
5B075ND20 ,  5B075NK07 ,  5B075NK39 ,  5B075NR02 ,  5B075NR12 ,  5B075PP10 ,  5B075PQ05 ,  5B075PR06 ,  5B075QM08

前のページに戻る