Pat
J-GLOBAL ID:200903043374559059

キーワード抽出装置およびキーワード抽出方法

Inventor:
Applicant, Patent owner:
Gazette classification:公開公報
Application number (International application number):2001065121
Publication number (International publication number):2002269115
Application date: Mar. 08, 2001
Publication date: Sep. 20, 2002
Summary:
【要約】【課題】 単語の出現頻度、単語に対する修飾度、単語の文書中における生存期間などを点数化してキーワード性を判定することができるキーワード抽出装置およびキーワード抽出方法を提供すること。【解決手段】 入力文書から切り出した1文内を単語ごとに分割し、品詞を付与して品詞の並びに形態素解析し、この分割された単語を句レベルまでにまとめあげて合成し、構文解析13によって句間の構文解析を行う(S200〜203)。構文解析後に構文解析に誤りがないかどうかの確認として、名詞句の抽出を行い(S204)、修飾度の計算、名詞句出現頻度の計算、名詞句の登録を行う(S205〜207)。全ての文の処理を終えた場合(S208;Y)、単語の生存期間計算を行う(S209)。単語の出現頻度、修飾度、生存期間を評価式で計算して評価し、名詞句の集合からキーワードを抽出する(S211)。
Claim (excerpt):
受領した文章を一文ずつに分割し、この分割した各文に含まれている単語を抽出する単語抽出手段と、前記単語抽出手段によって抽出された各単語の出現頻度を計数する出現頻度計数手段と、前記単語抽出手段によって抽出された各単語による他の単語への修飾関係を示す修飾度を算出する修飾度算出手段と、前記単語抽出手段によって抽出された各単語が受領した文章中にどのくらい長く存在しているかを表す単語の生存期間を算出する生存期間算出手段と、前記出現頻度計数手段によって計数された出現頻度、前記修飾度算出手段によって算出された修飾度および前記生存期間算出手段によって算出された生存期間を所定の評価式に従って評価する評価手段と、前記評価手段による評価結果に基づいて、前記単語抽出手段により抽出された所定の単語をキーワードとして抽出するキーワード抽出手段と、を備えたことを特徴とするキーワード抽出装置。
IPC (5):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 320 ,  G06F 17/30 340 ,  G06F 17/27
FI (5):
G06F 17/30 210 A ,  G06F 17/30 170 A ,  G06F 17/30 320 D ,  G06F 17/30 340 B ,  G06F 17/27 L
F-Term (9):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NK35 ,  5B075PR04 ,  5B075QP03 ,  5B091AA15 ,  5B091CA02 ,  5B091CA06
Patent cited by the Patent:
Cited by examiner (2)
  • 文書処理装置
    Gazette classification:公開公報   Application number:特願平7-268406   Applicant:沖電気工業株式会社
  • 特開平3-286372

Return to Previous Page