特許
J-GLOBAL ID:200903016029097746
キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
発明者:
,
,
出願人/特許権者:
,
代理人 (1件):
鈴江 武彦 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-245029
公開番号(公開出願番号):特開2000-076254
出願日: 1998年08月31日
公開日(公表日): 2000年03月14日
要約:
【要約】【課題】データベース内の各文書に対して形態素解析などの面倒な処理を施すことなく、キーワード抽出対象として与えられたテキストからデータベース内の各文書を考慮したキーワードを高精度に抽出する。【解決手段】単語抽出部12bによってキーワード抽出対象テキストから単語を抽出し、その抽出された各単語毎にテキスト内出現頻度を求めて単語管理表13bに格納する。また、単語検索実行部12cにより、上記抽出された各単語毎に文書データベース格納部11b内の各文書をフルテキストサーチしてデータベース内出現頻度を求めて単語管理表13bに格納する。重要度計算部12dにより、この単語管理表13bに格納されたテキスト内出現頻度とデータベース内出現頻度に基づいて各単語の重要度を計算し、キーワード決定部12eにより、各単語の重要度に基づいてキーワードを決定する。
請求項(抜粋):
複数の文書を格納したデータベースと、キーワード抽出対象として与えられたテキストを取得するテキスト取得手段と、このテキスト取得手段によって得られたテキストから単語を抽出し、その抽出された各単語毎に上記テキスト内での出現頻度を求めるテキスト内単語抽出手段と、このテキスト内単語抽出手段によって抽出された各単語について、上記データベース内の各文書をフルテキストサーチし、上記データベース内での出現頻度を求めるデータベース内単語検索手段と、上記テキスト内単語抽出手段によって得られた上記テキスト内での出現頻度と上記データベース内単語検索手段によって得られた上記データベース内での出現頻度に基づいて各単語の重要度を計算する重要度算出手段と、この重要度算出手段によって得られた各単語の重要度に基づいて上記テキストのキーワードとなる単語を決定するキーワード決定手段とを具備したことを特徴とするキーワード抽出装置。
Fターム (7件):
5B075ND03
, 5B075NK14
, 5B075NK32
, 5B075PP25
, 5B075PQ36
, 5B075PR06
, 5B075QS01
前のページに戻る