Pat
J-GLOBAL ID:200903010213999037
文書のキーワード抽出方法及び文書検索装置
Inventor:
,
Applicant, Patent owner:
,
Agent (1):
鈴江 武彦
Gazette classification:公開公報
Application number (International application number):1995106582
Publication number (International publication number):1996305710
Application date: Apr. 28, 1995
Publication date: Nov. 22, 1996
Summary:
【要約】【目的】本発明は、文書の鍵となるキーワードを自動的かつ効果的に抽出することを目的としたものである。【構成】文書のキーワード付け処理やデータ処理を行なうCPUやメモリからなる制御装置1と、文書や処理指示などを入力するキーボード等からなる入力装置1、文書に付与されたキーワードや処理結果を表示するディスプレイ等からなる出力装置3、文書のキーワード付けのためのデータベースなどを格納するHDD等の外部記憶装置4とを備え、制御装置1の制御の下に、文書データベースの他の文書と比較して特徴のある文書のキーワードを抽出することができる。
Claim (excerpt):
文書中に含まれる単語のうち、文書の要旨を知るための鍵となるキーワードを抽出する方法であって、複数文書から文書中に含まれる単語を抽出し、当該の単語を複数文書内での出現回数順に並び替えてランク付けし、抽出した単語の種数で正規化した総文書単語ランク付けデータベースと、キーワード抽出対象文書に対して前記総文書単語ランク付けデータベースと同様の方法で作成した単語ランク付けデータベースを基にして、キーワード抽出対象文書から抽出した単語に関する総文書単語ランク付けデータベースと単語ランク付けデータベースでの各々のランクを求め、その差分が許容された範囲以上に単語ランク付けデータベースでのランクが高い場合に、その単語がキーワード抽出対象文書のキーワードであると判断することを特徴とする文書のキーワード抽出方法。
Patent cited by the Patent:
Cited by examiner (9)
-
特開平2-244274
-
特開平4-281565
-
特開昭63-156230
-
特開昭57-117069
-
特開昭52-132653
-
キーワード付与システム
Gazette classification:公開公報
Application number:特願平5-172464
Applicant:株式会社日立製作所
-
形態素解析装置及びキーワード抽出装置
Gazette classification:公開公報
Application number:特願平5-086154
Applicant:松下電器産業株式会社
-
特開昭63-049928
-
特開平1-102638
Show all
Return to Previous Page