特許
J-GLOBAL ID:201103068168617558
構造化文書分析装置と方法、及び構造化文書分析プログラムと構造化文書分析プログラムを格納した記憶媒体
発明者:
,
出願人/特許権者:
代理人 (2件):
橋本 剛
, 鵜澤 英久
公報種別:特許公報
出願番号(国際出願番号):特願2002-103239
公開番号(公開出願番号):特開2003-296344
特許番号:特許第4025572号
出願日: 2002年04月05日
公開日(公表日): 2003年10月17日
請求項(抜粋):
【請求項1】 プロパティと文章が記述された構造化文書を分析する構造化文書分析装置において、
構造化文書を読み込み、各構造化文書に文書IDを付与し、設定情報に基づきプロパティと文書に分ける構造化文書ローダと、
該プロパティと文書IDを格納し、データ分析条件により分析するデータ分析手段と、
該文章と文書IDを格納し、テキスト分析条件により分析するテキスト分析手段と、
該データ分析条件及び該テキスト分析条件を入力されるとともに、該データ分析手段で得られたデータ分析結果及び該テキスト分析手段で得られたテキスト分析結果を該文書IDを用いて統合する統合分析手段と、
該統合された分析結果を表示する表示インターフェースとを有し、
前記テキスト分析手段は、
文章と対象文章構造の指定をテキスト分析条件として受け取り、
該受け取った文章と、該指定された対象文書構造に対応付けられて格納されている各文章の内容とがどの程度類似しているのかを計算し、
該計算結果の類似度順に文書IDをソートし、該ソートされた文書IDと類似度のペアをテキスト分析結果として統合分析手段に出力する
ことを特徴とする構造化文書分析装置。
IPC (1件):
FI (4件):
G06F 17/30 220 Z
, G06F 17/30 140
, G06F 17/30 170 A
, G06F 17/30 210 D
引用文献:
前のページに戻る