Pat
J-GLOBAL ID:200903010213999037

文書のキーワード抽出方法及び文書検索装置

Inventor:
Applicant, Patent owner:
Agent (1): 鈴江 武彦
Gazette classification:公開公報
Application number (International application number):1995106582
Publication number (International publication number):1996305710
Application date: Apr. 28, 1995
Publication date: Nov. 22, 1996
Summary:
【要約】【目的】本発明は、文書の鍵となるキーワードを自動的かつ効果的に抽出することを目的としたものである。【構成】文書のキーワード付け処理やデータ処理を行なうCPUやメモリからなる制御装置1と、文書や処理指示などを入力するキーボード等からなる入力装置1、文書に付与されたキーワードや処理結果を表示するディスプレイ等からなる出力装置3、文書のキーワード付けのためのデータベースなどを格納するHDD等の外部記憶装置4とを備え、制御装置1の制御の下に、文書データベースの他の文書と比較して特徴のある文書のキーワードを抽出することができる。
Claim (excerpt):
文書中に含まれる単語のうち、文書の要旨を知るための鍵となるキーワードを抽出する方法であって、複数文書から文書中に含まれる単語を抽出し、当該の単語を複数文書内での出現回数順に並び替えてランク付けし、抽出した単語の種数で正規化した総文書単語ランク付けデータベースと、キーワード抽出対象文書に対して前記総文書単語ランク付けデータベースと同様の方法で作成した単語ランク付けデータベースを基にして、キーワード抽出対象文書から抽出した単語に関する総文書単語ランク付けデータベースと単語ランク付けデータベースでの各々のランクを求め、その差分が許容された範囲以上に単語ランク付けデータベースでのランクが高い場合に、その単語がキーワード抽出対象文書のキーワードであると判断することを特徴とする文書のキーワード抽出方法。
Patent cited by the Patent:
Cited by examiner (9)
  • 特開平2-244274
  • 特開平4-281565
  • 特開昭63-156230
Show all

Return to Previous Page