特許
J-GLOBAL ID:201303030367830020

文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体

発明者:
出願人/特許権者:
代理人 (4件): 小林 博通 ,  鵜澤 英久 ,  山口 幸二 ,  橋本 剛
公報種別:特許公報
出願番号(国際出願番号):特願2006-237663
公開番号(公開出願番号):特開2008-059442
特許番号:特許第4769151号
出願日: 2006年09月01日
公開日(公表日): 2008年03月13日
請求項(抜粋):
【請求項1】 文書データ管理手段によって管理される文書集合内の文書間の関連性に基づいて、文書の役割を特定する文書集合分析装置であって、 入力手段から入力された文書集合特定条件に基づいて前記文書集合を特定する文書集合特定手段と、 前記特定された文書集合に含まれる各文書間で話題語に関する類似度を評価する類似性評価手段と、 前記類似性評価手段によって評価された類似度に基づいて、文書間の関係性を抽出する関係抽出手段と、 前記関係抽出手段によって抽出された文書間の関係性に基づき、文書と該文書以外の文書間の関連性の高さを示す指標として、該文書の中心性を算出する中心性判定手段と、 前記関係抽出手段によって得られた文書間の関連性と、各文書の中心性に基づいて、文書間の関連性を二次元座標で表現し、その二次元座標に対する三次元目の座標で中心性を表現し、前記文書集合を三次元のグラフ構造で表現するグラフ構造構築手段と、 前記得られたグラフ構造において前記文書集合のうち中心性のスコアが極大となっている文書ノードを頂点ノードとして抽出する頂点ノード抽出手段と、 前記抽出された頂点ノードと、当該頂点ノードと連結されていると共に中心性のスコアが当該頂点ノードの中心性のスコアよりも低く且つ極小でない一つ以上の文書ノードとで構成される文書ノード群を山状ノード群と特定する山状ノード群特定手段と、 前記抽出された頂点ノードに対して当該ノードは前記文書集合の話題語の役割をなすものであることを示すラベルを付与すると共に、前記特定された山状ノード群に対して当該ノード群は前記話題語と関連性を有する文書集合の役割をなすものであることであることを示すラベルを付与するラベル付け手段と、 前記話題語の役割をなすものとしてラベル付けされた頂点ノードを示す文書ノード、前記話題語と関連性を有する文書集合の役割をなすものとしてラベル付けされた山状ノード群を示す文書ノード群を可視化して出力する情報出力手段と、 を備えることを特徴とする文書集合分析装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (3件):
G06F 17/30 220 Z ,  G06F 17/30 419 B ,  G06F 17/30 360 Z
引用特許:
審査官引用 (3件)
引用文献:
審査官引用 (1件)
  • リサーチマイニング手法を用いた研究の発展経緯可視化ツール

前のページに戻る