特許
J-GLOBAL ID:201203067744656271
期間別主題語句抽出装置及び方法及びプログラム
発明者:
,
,
出願人/特許権者:
代理人 (2件):
伊東 忠彦
, 石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2010-153246
公開番号(公開出願番号):特開2012-014643
出願日: 2010年07月05日
公開日(公表日): 2012年01月19日
要約:
【課題】期間毎の主題語句と主題語句間の関連度を同時に算出することで、話題の関連と推移の確認を可能にする。【解決手段】方法は、文書集合を期間別に分割し、文書を語句の集合に分解し、各期間の文書のタイトル中に出現する語句の統計情報を集計し、各期間の文書の全文中に出現する語句の統計情報を集計し、タイトル中語句統計情報の集計結果と全文中語句統計情報の集計結果を基に、期間毎に主題を表す語句を複数抽出する。また、各主題語句が含まれる文書を収集し、収集結果を基に、2つの主題語句間の関連度を計算する。【選択図】図1
請求項(抜粋):
文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出装置であって、
文書集合を期間別に分割する期間別文書分割手段と、
文書を語句の集合に分解する形態素解析手段と、
各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計手段と、
各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計手段と、
前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計手段の集計結果と前記第2の記憶手段に格納されている全文中語句統計情報手段の集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出手段と、
を有することを特徴とする期間別主題語句抽出装置。
IPC (1件):
FI (2件):
G06F17/30 340B
, G06F17/30 170A
Fターム (6件):
5B075ND03
, 5B075NK02
, 5B075NK32
, 5B075PQ75
, 5B075PQ76
, 5B075PR04
引用特許:
前のページに戻る