特許
J-GLOBAL ID:200903017647566087

文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 橋本 剛 ,  鵜澤 英久
公報種別:公開公報
出願番号(国際出願番号):特願2006-237663
公開番号(公開出願番号):特開2008-059442
出願日: 2006年09月01日
公開日(公表日): 2008年03月13日
要約:
【課題】強い繋がりが存在する文書集合のみを特定し、その文書集合をクラスタに分類し、そのクラスタ中の各文書の役割を明確に分析する。【解決手段】特定条件に基づいて文書集合を特定する手段10と、前記特定された文書集合に含まれる各文書間の類似性を評価する手段20と、前記評価された類似性に基づいて、文書間の関係性を抽出する手段30と、前記抽出された文書間の関係性に基づき、該文書の中心性を算出する手段40によって、文書間の関係性と文書の中心性を取得する。そして、前記取得した文書間の関係性と、取得した個々の文書の中心性に基づいて、話題語,話題語に関連する文書集合,文書の役割を特定する手段50によって、それら特定し、可視化して出力する。【選択図】図1
請求項(抜粋):
文書データ管理手段によって管理される文書集合内の文書間の関連性に基づいて、文書の役割を特定する文書集合分析装置であって、 入力手段から入力された文書集合特定条件に基づいて前記文書集合を特定する文書集合特定手段と、 前記特定された文書集合に含まれる各文書間で話題語に関する類似度を評価する類似性評価手段と、 前記類似性評価手段によって評価された類似度に基づいて、文書間の関係性を抽出する関係抽出手段と、 前記関係抽出手段によって抽出された文書間の関係性に基づき、文書と該文書以外の文書間の関連性の高さを示す指標として、該文書の中心性を算出する中心性判定手段と、 前記関係抽出手段によって得られた文書間の関係性と、中心性判定手段によって得られた個々の文書の中心性に基づいて、文書集合全体から文書集合中に含まれる話題語,話題語に関連する文書集合,その文書集合中における文書の役割を特定する情報分析手段と、 前記特定された文書集合全体から文書集合中に含まれる話題語,話題語に関連する文書集合,その文書集合中における文書の役割に基づいて文書集合を可視化して出力する情報出力手段と、 を備えることを特徴とする文書集合分析装置。
IPC (2件):
G06F 17/30 ,  G06F 19/00
FI (4件):
G06F17/30 220Z ,  G06F17/30 210D ,  G06F17/30 360Z ,  G06F19/00 130
Fターム (12件):
5B075ND03 ,  5B075NK31 ,  5B075NR02 ,  5B075NR12 ,  5B075NS10 ,  5B075PQ02 ,  5B075PQ14 ,  5B075PQ38 ,  5B075PQ46 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (3件)
引用文献:
出願人引用 (1件)
  • リサーチマイニング手法を用いた研究の発展経緯可視化ツール
審査官引用 (1件)
  • リサーチマイニング手法を用いた研究の発展経緯可視化ツール

前のページに戻る