Pat
J-GLOBAL ID:201203067744656271

期間別主題語句抽出装置及び方法及びプログラム

Inventor:
Applicant, Patent owner:
Agent (2): 伊東 忠彦 ,  石原 隆治
Gazette classification:公開公報
Application number (International application number):2010153246
Publication number (International publication number):2012014643
Application date: Jul. 05, 2010
Publication date: Jan. 19, 2012
Summary:
【課題】期間毎の主題語句と主題語句間の関連度を同時に算出することで、話題の関連と推移の確認を可能にする。【解決手段】方法は、文書集合を期間別に分割し、文書を語句の集合に分解し、各期間の文書のタイトル中に出現する語句の統計情報を集計し、各期間の文書の全文中に出現する語句の統計情報を集計し、タイトル中語句統計情報の集計結果と全文中語句統計情報の集計結果を基に、期間毎に主題を表す語句を複数抽出する。また、各主題語句が含まれる文書を収集し、収集結果を基に、2つの主題語句間の関連度を計算する。【選択図】図1
Claim (excerpt):
文書集合から各期間の主題を表す語句を抽出する期間別主題語句抽出装置であって、 文書集合を期間別に分割する期間別文書分割手段と、 文書を語句の集合に分解する形態素解析手段と、 各期間の文書のタイトル中に出現する語句の統計情報を集計し、第1の記憶手段に格納するタイトル中語句統計情報集計手段と、 各期間の文書の全文中に出現する語句の統計情報を集計し、第2の記憶手段に格納する全文中語句統計情報集計手段と、 前記第1の記憶手段に格納されている前記タイトル中語句統計情報集計手段の集計結果と前記第2の記憶手段に格納されている全文中語句統計情報手段の集計結果を基に、期間毎に主題を表す語句を複数抽出する主題語句抽出手段と、 を有することを特徴とする期間別主題語句抽出装置。
IPC (1):
G06F 17/30
FI (2):
G06F17/30 340B ,  G06F17/30 170A
F-Term (6):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075PQ75 ,  5B075PQ76 ,  5B075PR04
Patent cited by the Patent:
Cited by examiner (9)
Show all

Return to Previous Page