特許
J-GLOBAL ID:200903086013639717
キーワード抽出装置および情報検索装置
発明者:
,
,
出願人/特許権者:
,
代理人 (1件):
深見 久郎 (外4名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-394194
公開番号(公開出願番号):特開2002-197095
出願日: 2000年12月26日
公開日(公表日): 2002年07月12日
要約:
【要約】【課題】 辞書を必要とせずにドキュメントよりキーワードを抽出する。【解決手段】 キーワード抽出装置は、ドキュメント群を受け、ドキュメント群から後述するサフィックスファイルを作成するサフィックスファイル作成部22と、サフィックスファイルを記憶するサフィックスファイル記憶部24と、ドキュメント群に含まれる任意のドキュメントまたはドキュメント群と同じ分野のドキュメントを受け、「、」や「。」などの文章の切れ目でドキュメント分割する区切り部28と、サフィックスファイルおよび区切り部28より供給された文章に基づいて、文章を適宜区切り、後述する出現頻度α、出現集中度βおよび重みなどの計算を行なうスコア計算部26と、演算結果を記憶する演算結果記憶部30と、演算結果に基づいて、ドキュメントをキーワードの候補に分割していくドキュメント分割部32と、キーワード候補を絞込む絞込み部34とを含む。
請求項(抜粋):
ドキュメント群における各ドキュメントに含まれる部分文字列の前記ドキュメント群中での出現頻度を求めるための出現頻度算出手段と、前記部分文字列の前記ドキュメント群中での出現集中度を求めるための出現集中度算出手段と、前記出現頻度算出手段および前記出現集中度算出手段に接続され、前記出現頻度および前記出現集中度に基づいて、入力されたドキュメントからキーワードを抽出するための第1のキーワード抽出手段とを含む、キーワード抽出装置。
IPC (4件):
G06F 17/30 210
, G06F 17/30 170
, G06F 17/30 340
, G06F 17/30 350
FI (4件):
G06F 17/30 210 A
, G06F 17/30 170 A
, G06F 17/30 340 B
, G06F 17/30 350 C
Fターム (9件):
5B075ND03
, 5B075NK31
, 5B075PP02
, 5B075PP03
, 5B075PP22
, 5B075PQ02
, 5B075PR04
, 5B075PR06
, 5B075QM08
前のページに戻る