Pat
J-GLOBAL ID:200903076352549802

文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 喜三郎 (外2名)
Gazette classification:公開公報
Application number (International application number):1998337389
Publication number (International publication number):2000163437
Application date: Nov. 27, 1998
Publication date: Jun. 16, 2000
Summary:
【要約】【課題】 膨大な文書の中からユーザの所望とする文書を適切に抽出するために文書を高精度に分類する。【解決手段】 処理対象文書を1次元文字列に展開して、キーワード設定部20によって設定されたキーワードの出現位置を1次元文字列上で特定し、その1次元文字列上で重み付け範囲を設定し、その範囲の中心文字位置付近におけるキーワードの出現に対しては重みを重くし中心から離れるに従って重みを軽くするような重み付け関数を用いて前記重み付け範囲の中心におけるキーワード出現密度を、重み付け範囲の中心をずらしながら順次算出するキーワード出現密度計算部7と、このキーワード出現密度計算部7で求められたキーワード出現密度に基づいて前記処理対象文書の1次元文字列上におけるキーワード出現密度分布を得て、このキーワード出現密度分布から前記ユーザ検索要求に対する当該文書の有用度を求める有用文書判定部8とを有する構成とする。
Claim (excerpt):
ユーザの検索要求に基づいて多数の文書群の文書を分類して、その分類結果を出力する文書分類方法において、処理対象文書を1次元文字列に展開して、前記ユーザの検索要求に基づくキーワードの出現位置を前記1次元文字列上において特定するとともに、その1次元文字列上で所定の範囲を重み付け範囲として設定し、その重み付け範囲の中心位置付近におけるキーワードの出現に対しては重みを重くし、中心から離れるに従って重みを軽くするような重み付け関数を用いて前記設定された重み付け範囲の中心文字位置に対するキーワード出現密度を前記中心文字位置をずらしながら順次算出することによって、前記1次元文字列上におけるキーワード出現密度分布を得て、このキーワード出現密度分布から前記ユーザの検索要求に対する当該処理対象文書の有用度を求め、その有用度によって複数の処理対象文書の分類を行うことを特徴とする文書分類方法。
FI (2):
G06F 15/401 310 D ,  G06F 15/401 320 A
F-Term (13):
5B075ND03 ,  5B075NK31 ,  5B075NS01 ,  5B075PP25 ,  5B075PQ02 ,  5B075PQ22 ,  5B075PQ38 ,  5B075PQ75 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08 ,  5B075QP01 ,  5B075UU06
Patent cited by the Patent:
Cited by examiner (1)
  • 特許第2601139号

Return to Previous Page