特許
J-GLOBAL ID:200903020821832027

文書分類装置および文書分類方法

発明者:
出願人/特許権者:
代理人 (7件): 三好 秀和 ,  岩▲崎▼ 幸邦 ,  川又 澄雄 ,  中村 友之 ,  伊藤 正和 ,  高橋 俊一 ,  高松 俊雄
公報種別:公開公報
出願番号(国際出願番号):特願2004-285367
公開番号(公開出願番号):特開2006-099478
出願日: 2004年09月29日
公開日(公表日): 2006年04月13日
要約:
【課題】 一括処理を利用する文書分類方式において、対話的に分類結果を調整することが可能な文書分類装置を提供する。【解決手段】 比較対象文書の情報と比較対象文書の分野が関連付けられた比較対象文書情報を記憶している比較対象文書情報記憶部と、単語と単語重みを記憶している単語重み情報記憶部と、分類キー文書を比較対象文書情報と比較して分類キー文書および比較対象文書で共通に使用されている共通使用単語を抽出し、共通使用単語と共通使用単語の使用回数と単語重み情報記憶部から単語重みを読み出した共通使用単語の単語重みとが関連づけられた共通単語情報を生成する一括処理制御部と、共通単語情報から複数の比較対象文書と前記分類キー文書との類似度を求め、求められた類似度の高い比較対象文書に基づいて分野を特定し、入力装置からの指示に基づいて、特定した分野を調整する対話処理制御部とを有する。【選択図】 図1
請求項(抜粋):
文書の属する分野を分類する対象となる分類キー文書を分類する文書分類装置であって、 前記分類キー文書と比較する比較対象文書の情報と、この比較対象文書の分野が関連付けられた比較対象文書情報を記憶している比較対象文書情報記憶部と、 単語と、前記単語が含まれている文書の分野の特徴を示す指標となる単語重みを記憶している単語重み情報記憶部と、 前記分類キー文書を前記比較対象文書情報と比較して分類キー文書および比較対象文書で共通に使用されている単語である共通使用単語を抽出し、少なくともこれらの共通使用単語と、共通使用単語の使用回数と、前記単語重み情報記憶部から読み出した共通使用単語の単語重みとが関連づけられた共通単語情報を生成する一括処理制御部と、 前記共通単語情報から複数の比較対象文書と前記分類キー文書との類似度を求め、求められた類似度の高い比較対象文書に基づいて分野を特定し、さらに、入力装置からの指示に基づいて、特定した分野を調整する対話処理制御部と、 を有することを特徴とする文書分類装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 210D ,  G06F17/30 170A ,  G06F17/30 350C
Fターム (9件):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NR12 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08 ,  5B075QP01 ,  5B075UU06
引用特許:
出願人引用 (1件) 審査官引用 (11件)
全件表示
引用文献:
前のページに戻る