特許
J-GLOBAL ID:200903037052093305

インデックス作成装置及びその方法、文書検索装置及びその方法、文書検索システム、データベース作成装置及びその方法、記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 西山 恵三 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-048525
公開番号(公開出願番号):特開2000-339347
出願日: 2000年02月25日
公開日(公表日): 2000年12月08日
要約:
【要約】【課題】 構造と内容から構造化文書をセグメントに分割し、与えられた検索キーを含むセグメントを検索結果として提示することで、検索条件に適合した文書の部分を検索結果とすること。【解決手段】 文書を特定のタグによってセグメントに分割し(S301)、イメージを含むセグメントについては隣接セグメントとの関連度を算出して所定の関連度を有する隣接セグメントと併合する(S302)。見出しタグによって見出しを検出し、見出しの範囲に含まれるセグメントに見出し情報を付加する(S303)。セグメントを文書に分割してから、文書間の関連度に応じて文書を結合し、セグメントの見出し及びそれ以外の部分のそれぞれに対してインデックスを作成する(S305)。検索は2つのインデックスに対して行い、インデックスに対する検索結果に重み付けをつけて適合度を算出し、この適合度によって判定した検索結果をセグメント単位で出力する。
請求項(抜粋):
文書中に、当該文書を処理する装置がコマンドとして解釈可能な文字が含まれる被検索文書の検索用インデックスを作成するインデックス作成装置であって、前記被検索文書を保持する被検索文書保持手段と、該被検索文書保持手段に保持されている前記被検索文書から、前記コマンドとして解釈可能な文字に応じて第1次セグメントを抽出する文書分割手段と、前記第1次セグメントをその関連性に応じて統合し、第2次セグメントとする結束性処理手段と、前記第2次セグメントのそれぞれについて前記検索用インデックスを作成するインデックス作成手段と、を有することを特徴とするインデックス作成装置。
FI (3件):
G06F 15/40 370 A ,  G06F 15/401 310 Z ,  G06F 15/413 310 Z
引用特許:
審査官引用 (6件)
全件表示
引用文献:
前のページに戻る