特許
J-GLOBAL ID:201403084983064978
文書トピック抽出装置及び方法及びプログラム
発明者:
,
出願人/特許権者:
代理人 (3件):
伊東 忠重
, 伊東 忠彦
, 石原 隆治
公報種別:特許公報
出願番号(国際出願番号):特願2011-087679
公開番号(公開出願番号):特開2012-221316
特許番号:特許第5587821号
出願日: 2011年04月11日
公開日(公表日): 2012年11月12日
請求項(抜粋):
【請求項1】 複数の文書を含む文書群内の各文書のトピックを抽出するトピック抽出装置であって、
文書群を入力する入力手段と、
入力された各文書の特徴語である対象文書特徴語を抽出する対象文書特徴語抽出手段と、
入力された各文書の関連文書を抽出する関連文書抽出手段と、
前記関連文書の特徴語である関連文書特徴語を抽出する関連文書特徴語抽出手段と、
前記対象文書特徴語と前記関連文書特徴語を統合した語集合内において、出現頻度に基づくスコアが大きい対象文書特徴語を対象文書のトピックとして抽出する対象文書トピック抽出手段と、
抽出した前記トピックを出力するトピック出力手段と、
を有し、
前記対象文書トピック抽出手段は、
前記対象文書特徴語と前記関連文書特徴語を統合した語集合内において、出現頻度、および、該語集合内の各語との概念の近さに基づくスコアが大きい対象文書特徴語を前記対象文書のトピックとして抽出する手段を含む
ことを特徴とするトピック抽出装置。
IPC (2件):
G06F 17/30 ( 200 6.01)
, G06F 17/21 ( 200 6.01)
FI (4件):
G06F 17/30 220 B
, G06F 17/30 210 A
, G06F 17/30 210 D
, G06F 17/21 550 A
引用特許:
出願人引用 (2件)
-
文書表示システム
公報種別:公開公報
出願番号:特願2008-262507
出願人:コニカミノルタホールディングス株式会社
-
情報処理装置及び情報処理方法
公報種別:公開公報
出願番号:特願2008-048270
出願人:株式会社東芝
審査官引用 (2件)
-
文書表示システム
公報種別:公開公報
出願番号:特願2008-262507
出願人:コニカミノルタホールディングス株式会社
-
情報処理装置及び情報処理方法
公報種別:公開公報
出願番号:特願2008-048270
出願人:株式会社東芝
前のページに戻る