特許
J-GLOBAL ID:200903066762505424

文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置

発明者:
出願人/特許権者:
代理人 (1件): 三好 秀和 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-061096
公開番号(公開出願番号):特開2001-249951
出願日: 2000年03月06日
公開日(公表日): 2001年09月14日
要約:
【要約】【課題】 文書集合を構成する文書の特徴を要素とするベクトルデータを文書集合の特徴量とすることにより文書集合の類似性判定および類似した文書集合の検索を適確に行い得る文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置を提供する。【解決手段】 文書集合s1,s2,s3を構成する全文書d11,d12,d13,d21,d22,d23,d31,d32,d33でツリーtを構成し、このように構成されるツリーtをいくつかのセグメントg1,g2に分割し、各文書集合s1,s2,s3について、分割した各セグメントg1,g2の中にいくつの文書が含まれるかという分布を各文書集合s1,s2,s3の特徴量s1(1,2),s2(2,1),s3(1,2)として決定する。
請求項(抜粋):
単一または複数の文書からなる文書集合を特徴量で表現するための文書集合特徴化方法であって、文書集合を構成する文書の特徴を要素とするベクトルデータを前記文書集合の特徴量とすることを特徴とする文書集合特徴化方法。
IPC (2件):
G06F 17/30 350 ,  G06F 17/30 170
FI (2件):
G06F 17/30 350 C ,  G06F 17/30 170 A
Fターム (4件):
5B075ND03 ,  5B075NK06 ,  5B075PR06 ,  5B075QM08
引用特許:
審査官引用 (2件)

前のページに戻る