特許
J-GLOBAL ID:200903076352549802
文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
発明者:
出願人/特許権者:
代理人 (1件):
鈴木 喜三郎 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-337389
公開番号(公開出願番号):特開2000-163437
出願日: 1998年11月27日
公開日(公表日): 2000年06月16日
要約:
【要約】【課題】 膨大な文書の中からユーザの所望とする文書を適切に抽出するために文書を高精度に分類する。【解決手段】 処理対象文書を1次元文字列に展開して、キーワード設定部20によって設定されたキーワードの出現位置を1次元文字列上で特定し、その1次元文字列上で重み付け範囲を設定し、その範囲の中心文字位置付近におけるキーワードの出現に対しては重みを重くし中心から離れるに従って重みを軽くするような重み付け関数を用いて前記重み付け範囲の中心におけるキーワード出現密度を、重み付け範囲の中心をずらしながら順次算出するキーワード出現密度計算部7と、このキーワード出現密度計算部7で求められたキーワード出現密度に基づいて前記処理対象文書の1次元文字列上におけるキーワード出現密度分布を得て、このキーワード出現密度分布から前記ユーザ検索要求に対する当該文書の有用度を求める有用文書判定部8とを有する構成とする。
請求項(抜粋):
ユーザの検索要求に基づいて多数の文書群の文書を分類して、その分類結果を出力する文書分類方法において、処理対象文書を1次元文字列に展開して、前記ユーザの検索要求に基づくキーワードの出現位置を前記1次元文字列上において特定するとともに、その1次元文字列上で所定の範囲を重み付け範囲として設定し、その重み付け範囲の中心位置付近におけるキーワードの出現に対しては重みを重くし、中心から離れるに従って重みを軽くするような重み付け関数を用いて前記設定された重み付け範囲の中心文字位置に対するキーワード出現密度を前記中心文字位置をずらしながら順次算出することによって、前記1次元文字列上におけるキーワード出現密度分布を得て、このキーワード出現密度分布から前記ユーザの検索要求に対する当該処理対象文書の有用度を求め、その有用度によって複数の処理対象文書の分類を行うことを特徴とする文書分類方法。
FI (2件):
G06F 15/401 310 D
, G06F 15/401 320 A
Fターム (13件):
5B075ND03
, 5B075NK31
, 5B075NS01
, 5B075PP25
, 5B075PQ02
, 5B075PQ22
, 5B075PQ38
, 5B075PQ75
, 5B075PR04
, 5B075PR06
, 5B075QM08
, 5B075QP01
, 5B075UU06
引用特許:
前のページに戻る