特許
J-GLOBAL ID:200903010213999037

文書のキーワード抽出方法及び文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦
公報種別:公開公報
出願番号(国際出願番号):特願平7-106582
公開番号(公開出願番号):特開平8-305710
出願日: 1995年04月28日
公開日(公表日): 1996年11月22日
要約:
【要約】【目的】本発明は、文書の鍵となるキーワードを自動的かつ効果的に抽出することを目的としたものである。【構成】文書のキーワード付け処理やデータ処理を行なうCPUやメモリからなる制御装置1と、文書や処理指示などを入力するキーボード等からなる入力装置1、文書に付与されたキーワードや処理結果を表示するディスプレイ等からなる出力装置3、文書のキーワード付けのためのデータベースなどを格納するHDD等の外部記憶装置4とを備え、制御装置1の制御の下に、文書データベースの他の文書と比較して特徴のある文書のキーワードを抽出することができる。
請求項(抜粋):
文書中に含まれる単語のうち、文書の要旨を知るための鍵となるキーワードを抽出する方法であって、複数文書から文書中に含まれる単語を抽出し、当該の単語を複数文書内での出現回数順に並び替えてランク付けし、抽出した単語の種数で正規化した総文書単語ランク付けデータベースと、キーワード抽出対象文書に対して前記総文書単語ランク付けデータベースと同様の方法で作成した単語ランク付けデータベースを基にして、キーワード抽出対象文書から抽出した単語に関する総文書単語ランク付けデータベースと単語ランク付けデータベースでの各々のランクを求め、その差分が許容された範囲以上に単語ランク付けデータベースでのランクが高い場合に、その単語がキーワード抽出対象文書のキーワードであると判断することを特徴とする文書のキーワード抽出方法。
引用特許:
審査官引用 (9件)
  • 特開平2-244274
  • 特開平4-281565
  • 特開昭63-156230
全件表示

前のページに戻る