Pat
J-GLOBAL ID:201103004251202248

トピックワード抽出装置、トピックワード抽出システム、トピックワード抽出方法、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (3): 宮崎 昭夫 ,  石橋 政幸 ,  緒方 雅昭
Gazette classification:公開公報
Application number (International application number):2009219023
Publication number (International publication number):2011070291
Application date: Sep. 24, 2009
Publication date: Apr. 07, 2011
Summary:
【課題】オフラインにおいて、少ない処理量でテキストからトピックワードを抽出する。【解決手段】トピックワード抽出装置は、集計期間内に予め収集された複数のテキストで使用されている単語について、該集計期間内で該単語が汎用的に使用された頻度を示す汎用度を単語ごとに算出する汎用度算出手段と、入力テキストが入力されると、該入力テキストから単語を抽出し、該入力テキスト中で該単語が出現した出現頻度と、前記汎用度算出手段により算出された該単語の汎用度とに基づき、該出現頻度が高いほど高く、前記汎用度が低いほど高い値となるトピック重要度を算出するトピック重要度算出手段と、前記入力テキストから、前記トピック重要度算出手段により算出された前記トピック重要度が高い単語を優先してトピックワードとして抽出する抽出手段と、を有する。【選択図】図1
Claim (excerpt):
集計期間内に予め収集された複数のテキストで使用されている単語について、該集計期間内で該単語が汎用的に使用された頻度を示す汎用度を単語ごとに算出する汎用度算出手段と、 入力テキストが入力されると、該入力テキストから単語を抽出し、該入力テキスト中で該単語が出現した出現頻度と、前記汎用度算出手段により算出された該単語の汎用度とに基づき、該出現頻度が高いほど高く、前記汎用度が低いほど高い値となるトピック重要度を算出するトピック重要度算出手段と、 前記入力テキストから、前記トピック重要度算出手段により算出された前記トピック重要度が高い単語を優先してトピックワードとして抽出する抽出手段と、 を有するトピックワード抽出装置。
IPC (2):
G06F 19/00 ,  G06F 17/30
FI (4):
G06F19/00 130 ,  G06F17/30 210A ,  G06F17/30 170A ,  G06F17/30 220Z
F-Term (2):
5B075ND03 ,  5B075NK32
Patent cited by the Patent:
Cited by examiner (2)

Return to Previous Page