特許
J-GLOBAL ID:200903022554826457

文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 服部 毅巖
公報種別:公開公報
出願番号(国際出願番号):特願平9-166100
公開番号(公開出願番号):特開平10-207911
出願日: 1997年06月23日
公開日(公表日): 1998年08月07日
要約:
【要約】【課題】 文書内の文脈情報を考慮した上で、必要な箇所の検索を行う。【解決手段】 分類単位指定部2は、分類単位の指定を行う。論理構造解析部3は、文書を蓄積している文書蓄積部1から読み込んだ文書の論理構造を解析する。基本ベクトル生成部4は、文書の論理構造を分類単位で分割してキーワードを抽出し、基本ベクトルを生成する。見出しベクトル生成部5は、基本ベクトル生成の対象となった分類単位よりも上位に配置されている構成要素の見出しからキーワードを抽出し、見出しベクトルを生成する。ベクトル合成部6は、基本ベクトルと見出しベクトルとを合成して、合成ベクトルを生成する。合成ベクトル保持部7は、合成ベクトル生成の対象となった分類単位と合成ベクトルとを対応付けて保持する。分類部8は、保持された合成ベクトルの類似度に基づいて、文書の構成要素を分類単位毎に分類する。表示部10は、分類の結果を表示する。
請求項(抜粋):
ある構成要素が他の構成要素を含んでいくような木構造の論理構造を持った文書群を検索し、構成要素毎に分類して表示する文書検索装置において、前記文書を蓄積する文書蓄積手段と、分類しようとする前記構成要素の分類単位を指定する分類単位指定手段と、前記文書蓄積手段から文書を読み込み、その論理構造を解析する論理構造解析手段と、前記分類単位指定手段にて指定された分類単位の各構成要素の内容からキーワードを抽出し、基本ベクトルを生成する基本ベクトル生成手段と、前記分類単位の構成要素よりも論理構造的に上位に配置されているすべての構成要素の見出しからキーワードを抽出し、見出しベクトルを生成する見出しベクトル生成手段と、前記基本ベクトルと前記見出しベクトルとを合成し、合成ベクトルを生成するベクトル合成手段と、前記合成ベクトルを前記分類単位の構成要素と対応付けて保持する合成ベクトル保持手段と、前記合成ベクトルの類似度に基づいて、前記文書の構成要素を分類する分類手段と、前記分類手段による分類の結果を表示する表示手段と、を有することを特徴とする文書検索装置。
FI (5件):
G06F 15/401 310 D ,  G06F 15/40 370 A ,  G06F 15/401 310 A ,  G06F 15/403 350 C ,  G06F 15/419 310

前のページに戻る