Pat
J-GLOBAL ID:200903086013639717

キーワード抽出装置および情報検索装置

Inventor:
Applicant, Patent owner:
Agent (1): 深見 久郎 (外4名)
Gazette classification:公開公報
Application number (International application number):2000394194
Publication number (International publication number):2002197095
Application date: Dec. 26, 2000
Publication date: Jul. 12, 2002
Summary:
【要約】【課題】 辞書を必要とせずにドキュメントよりキーワードを抽出する。【解決手段】 キーワード抽出装置は、ドキュメント群を受け、ドキュメント群から後述するサフィックスファイルを作成するサフィックスファイル作成部22と、サフィックスファイルを記憶するサフィックスファイル記憶部24と、ドキュメント群に含まれる任意のドキュメントまたはドキュメント群と同じ分野のドキュメントを受け、「、」や「。」などの文章の切れ目でドキュメント分割する区切り部28と、サフィックスファイルおよび区切り部28より供給された文章に基づいて、文章を適宜区切り、後述する出現頻度α、出現集中度βおよび重みなどの計算を行なうスコア計算部26と、演算結果を記憶する演算結果記憶部30と、演算結果に基づいて、ドキュメントをキーワードの候補に分割していくドキュメント分割部32と、キーワード候補を絞込む絞込み部34とを含む。
Claim (excerpt):
ドキュメント群における各ドキュメントに含まれる部分文字列の前記ドキュメント群中での出現頻度を求めるための出現頻度算出手段と、前記部分文字列の前記ドキュメント群中での出現集中度を求めるための出現集中度算出手段と、前記出現頻度算出手段および前記出現集中度算出手段に接続され、前記出現頻度および前記出現集中度に基づいて、入力されたドキュメントからキーワードを抽出するための第1のキーワード抽出手段とを含む、キーワード抽出装置。
IPC (4):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 340 ,  G06F 17/30 350
FI (4):
G06F 17/30 210 A ,  G06F 17/30 170 A ,  G06F 17/30 340 B ,  G06F 17/30 350 C
F-Term (9):
5B075ND03 ,  5B075NK31 ,  5B075PP02 ,  5B075PP03 ,  5B075PP22 ,  5B075PQ02 ,  5B075PR04 ,  5B075PR06 ,  5B075QM08

Return to Previous Page