特許
J-GLOBAL ID:200903001671680202

重要語抽出装置、重要語抽出方法、および重要語抽出プログラム

発明者:
出願人/特許権者:
代理人 (1件): 工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願2004-032347
公開番号(公開出願番号):特開2005-222480
出願日: 2004年02月09日
公開日(公表日): 2005年08月18日
要約:
【課題】 重要語句の抽出に関して、効率と品質を高める。【解決手段】 多数の語句を含む文書から、その文書の内容を良好に表現する語句である重要語句を抽出する重要語抽出装置であって、連想度算出部と、候補語句選定部と、候補語句のあいだの連想度が所定の連想度閾値以上となる候補語句の集合を生成する集合生成部と、集合に含まれる各候補語句のうち1つを処理対象候補語句として選び、文書上における処理対象候補語句に対する位置が第1の定義距離内にあって、なおかつ集合に含まれる候補語句の数に応じた重要度を算出し、その重要度が所定の重要度閾値以上となるか否かを判定する重要性判定部とを備え、重要性判定部により重要度が重要度閾値以上であると判定された処理対象候補語句を、重要語句と決定する。【選択図】 図1
請求項(抜粋):
多数の語句を含む文書から、その文書の内容を良好に表現する語句である重要語句を抽出する重要語抽出装置であって、 語句のあいだの関連性の強さを示す連想度を算出する連想度算出部と、 前記文書中の複数の語句から、前記重要語句の候補となる候補語句を選定する候補語句選定部と、 前記候補語句のあいだの連想度を、前記連想度算出部に算出させ、その算出結果が所定の連想度閾値以上となる候補語句の集合を生成する集合生成部と、 当該集合に含まれる各候補語句のうち1つを処理対象候補語句として選び、前記文書上における当該処理対象候補語句に対する位置が第1の定義距離内にあって、なおかつ当該集合に含まれる候補語句の数に応じた重要度を算出し、その重要度が所定の重要度閾値以上となるか否かを判定する重要性判定部とを備え、 当該重要性判定部により前記重要度が重要度閾値以上であると判定された処理対象候補語句を、前記重要語句と決定することを特徴とする重要語抽出装置。
IPC (1件):
G06F17/30
FI (2件):
G06F17/30 210A ,  G06F17/30 170A
Fターム (8件):
5B075ND03 ,  5B075NK32 ,  5B075NK33 ,  5B075NR12 ,  5B075PR04 ,  5B075PR06 ,  5B075UU01 ,  5B075UU06

前のページに戻る