特許
J-GLOBAL ID:201103061488321474

文書評価方法及び装置及び文書評価プログラムを格納した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 小笠原 吉義 ,  森田 寛
公報種別:特許公報
出願番号(国際出願番号):特願2000-082089
公開番号(公開出願番号):特開2001-265788
特許番号:特許第3643516号
出願日: 2000年03月23日
公開日(公表日): 2001年09月28日
請求項(抜粋):
【請求項1】 文書の集合を入力とし、文書・単語間データベース作成手段と、文書・単語最適配置手段と、単語間距離変更手段と、単語最適配置手段と、文書最適配置手段と、文書間類似度評価手段とを有する装置を用いて、文書間の類似度を評価する文書評価方法において、 文書・単語間データベース作成手段が、前記文書集合に含まれる単語の集合をとり、文書に含まれる単語の頻度情報から、各文書と各単語との間の関連度を表すデータベースを作成する文書・単語間データベース作成過程を実行し、 文書・単語最適配置手段が、文書集合及び単語集合をそれぞれ確率変数と見なし、文書・単語間の関連度を文書集合と単語集合との同時確率分布と見なし、文書集合と単語集合との間の相関係数が最大になるように、文書及び単語に数値を割り当てることによって、文書集合と単語集合とのそれぞれの最適な配置を決定する文書・単語最適配置過程を実行し、 単語間距離変更手段が、前記文書・単語最適配置手段で決定された単語集合の配置から、任意の単語間の距離を計算し、シソーラスの情報をもとに、類似性の大きい単語間ほど距離が短くなるように単語間の距離を変更する単語間距離変更過程を実行し、 単語最適配置手段が、前記単語間距離変更手段で決定された単語間の距離値から算出される類似度をもとに、類似度の大きい単語間ほど距離が短く、類似度の小さい単語間ほど距離が長くなるように、各単語に数値を割り当てることによって単語集合の最適な配置を決定する単語最適配置過程を実行し、 文書最適配置手段が、文書集合及び単語集合をそれぞれ確率変数と見なし、文書・単語間の関連度を文書集合と単語集合との同時確率分布と見なし、前記単語最適配置手段で決定された単語集合の配置を固定した上で、文書集合と単語集合との間の相関係数が最大になるように、文書に数値を割り当てることによって、文書集合の最適な配置を決定する文書最適配置過程を実行し、 文書間類似度評価手段が、前記文書最適配置手段で決定された文書集合の配置から、任意の文書間の距離を計算し、この距離値にもとづいて文書間の類似度を評価する文書間類似度評価過程を実行する ことを特徴とする文書評価方法。
IPC (1件):
G06F 17/30
FI (2件):
G06F 17/30 350 C ,  G06F 17/30 170 A
引用特許:
審査官引用 (2件)

前のページに戻る