Pat
J-GLOBAL ID:200903016029097746

キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 鈴江 武彦 (外6名)
Gazette classification:公開公報
Application number (International application number):1998245029
Publication number (International publication number):2000076254
Application date: Aug. 31, 1998
Publication date: Mar. 14, 2000
Summary:
【要約】【課題】データベース内の各文書に対して形態素解析などの面倒な処理を施すことなく、キーワード抽出対象として与えられたテキストからデータベース内の各文書を考慮したキーワードを高精度に抽出する。【解決手段】単語抽出部12bによってキーワード抽出対象テキストから単語を抽出し、その抽出された各単語毎にテキスト内出現頻度を求めて単語管理表13bに格納する。また、単語検索実行部12cにより、上記抽出された各単語毎に文書データベース格納部11b内の各文書をフルテキストサーチしてデータベース内出現頻度を求めて単語管理表13bに格納する。重要度計算部12dにより、この単語管理表13bに格納されたテキスト内出現頻度とデータベース内出現頻度に基づいて各単語の重要度を計算し、キーワード決定部12eにより、各単語の重要度に基づいてキーワードを決定する。
Claim (excerpt):
複数の文書を格納したデータベースと、キーワード抽出対象として与えられたテキストを取得するテキスト取得手段と、このテキスト取得手段によって得られたテキストから単語を抽出し、その抽出された各単語毎に上記テキスト内での出現頻度を求めるテキスト内単語抽出手段と、このテキスト内単語抽出手段によって抽出された各単語について、上記データベース内の各文書をフルテキストサーチし、上記データベース内での出現頻度を求めるデータベース内単語検索手段と、上記テキスト内単語抽出手段によって得られた上記テキスト内での出現頻度と上記データベース内単語検索手段によって得られた上記データベース内での出現頻度に基づいて各単語の重要度を計算する重要度算出手段と、この重要度算出手段によって得られた各単語の重要度に基づいて上記テキストのキーワードとなる単語を決定するキーワード決定手段とを具備したことを特徴とするキーワード抽出装置。
F-Term (7):
5B075ND03 ,  5B075NK14 ,  5B075NK32 ,  5B075PP25 ,  5B075PQ36 ,  5B075PR06 ,  5B075QS01

Return to Previous Page