特許
J-GLOBAL ID:200903043374559059

キーワード抽出装置およびキーワード抽出方法

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願2001-065121
公開番号(公開出願番号):特開2002-269115
出願日: 2001年03月08日
公開日(公表日): 2002年09月20日
要約:
【要約】【課題】 単語の出現頻度、単語に対する修飾度、単語の文書中における生存期間などを点数化してキーワード性を判定することができるキーワード抽出装置およびキーワード抽出方法を提供すること。【解決手段】 入力文書から切り出した1文内を単語ごとに分割し、品詞を付与して品詞の並びに形態素解析し、この分割された単語を句レベルまでにまとめあげて合成し、構文解析13によって句間の構文解析を行う(S200〜203)。構文解析後に構文解析に誤りがないかどうかの確認として、名詞句の抽出を行い(S204)、修飾度の計算、名詞句出現頻度の計算、名詞句の登録を行う(S205〜207)。全ての文の処理を終えた場合(S208;Y)、単語の生存期間計算を行う(S209)。単語の出現頻度、修飾度、生存期間を評価式で計算して評価し、名詞句の集合からキーワードを抽出する(S211)。
請求項(抜粋):
受領した文章を一文ずつに分割し、この分割した各文に含まれている単語を抽出する単語抽出手段と、前記単語抽出手段によって抽出された各単語の出現頻度を計数する出現頻度計数手段と、前記単語抽出手段によって抽出された各単語による他の単語への修飾関係を示す修飾度を算出する修飾度算出手段と、前記単語抽出手段によって抽出された各単語が受領した文章中にどのくらい長く存在しているかを表す単語の生存期間を算出する生存期間算出手段と、前記出現頻度計数手段によって計数された出現頻度、前記修飾度算出手段によって算出された修飾度および前記生存期間算出手段によって算出された生存期間を所定の評価式に従って評価する評価手段と、前記評価手段による評価結果に基づいて、前記単語抽出手段により抽出された所定の単語をキーワードとして抽出するキーワード抽出手段と、を備えたことを特徴とするキーワード抽出装置。
IPC (5件):
G06F 17/30 210 ,  G06F 17/30 170 ,  G06F 17/30 320 ,  G06F 17/30 340 ,  G06F 17/27
FI (5件):
G06F 17/30 210 A ,  G06F 17/30 170 A ,  G06F 17/30 320 D ,  G06F 17/30 340 B ,  G06F 17/27 L
Fターム (9件):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NK35 ,  5B075PR04 ,  5B075QP03 ,  5B091AA15 ,  5B091CA02 ,  5B091CA06
引用特許:
審査官引用 (3件)
  • 文書処理装置
    公報種別:公開公報   出願番号:特願平7-268406   出願人:沖電気工業株式会社
  • 特開平3-286372
  • 特開平3-286372

前のページに戻る