特許
J-GLOBAL ID:201103004251202248
トピックワード抽出装置、トピックワード抽出システム、トピックワード抽出方法、及びプログラム
発明者:
,
出願人/特許権者:
代理人 (3件):
宮崎 昭夫
, 石橋 政幸
, 緒方 雅昭
公報種別:公開公報
出願番号(国際出願番号):特願2009-219023
公開番号(公開出願番号):特開2011-070291
出願日: 2009年09月24日
公開日(公表日): 2011年04月07日
要約:
【課題】オフラインにおいて、少ない処理量でテキストからトピックワードを抽出する。【解決手段】トピックワード抽出装置は、集計期間内に予め収集された複数のテキストで使用されている単語について、該集計期間内で該単語が汎用的に使用された頻度を示す汎用度を単語ごとに算出する汎用度算出手段と、入力テキストが入力されると、該入力テキストから単語を抽出し、該入力テキスト中で該単語が出現した出現頻度と、前記汎用度算出手段により算出された該単語の汎用度とに基づき、該出現頻度が高いほど高く、前記汎用度が低いほど高い値となるトピック重要度を算出するトピック重要度算出手段と、前記入力テキストから、前記トピック重要度算出手段により算出された前記トピック重要度が高い単語を優先してトピックワードとして抽出する抽出手段と、を有する。【選択図】図1
請求項(抜粋):
集計期間内に予め収集された複数のテキストで使用されている単語について、該集計期間内で該単語が汎用的に使用された頻度を示す汎用度を単語ごとに算出する汎用度算出手段と、
入力テキストが入力されると、該入力テキストから単語を抽出し、該入力テキスト中で該単語が出現した出現頻度と、前記汎用度算出手段により算出された該単語の汎用度とに基づき、該出現頻度が高いほど高く、前記汎用度が低いほど高い値となるトピック重要度を算出するトピック重要度算出手段と、
前記入力テキストから、前記トピック重要度算出手段により算出された前記トピック重要度が高い単語を優先してトピックワードとして抽出する抽出手段と、
を有するトピックワード抽出装置。
IPC (2件):
FI (4件):
G06F19/00 130
, G06F17/30 210A
, G06F17/30 170A
, G06F17/30 220Z
Fターム (2件):
引用特許:
前のページに戻る