Pat
J-GLOBAL ID:200903037052093305

インデックス作成装置及びその方法、文書検索装置及びその方法、文書検索システム、データベース作成装置及びその方法、記憶媒体

Inventor:
Applicant, Patent owner:
Agent (1): 西山 恵三 (外2名)
Gazette classification:公開公報
Application number (International application number):2000048525
Publication number (International publication number):2000339347
Application date: Feb. 25, 2000
Publication date: Dec. 08, 2000
Summary:
【要約】【課題】 構造と内容から構造化文書をセグメントに分割し、与えられた検索キーを含むセグメントを検索結果として提示することで、検索条件に適合した文書の部分を検索結果とすること。【解決手段】 文書を特定のタグによってセグメントに分割し(S301)、イメージを含むセグメントについては隣接セグメントとの関連度を算出して所定の関連度を有する隣接セグメントと併合する(S302)。見出しタグによって見出しを検出し、見出しの範囲に含まれるセグメントに見出し情報を付加する(S303)。セグメントを文書に分割してから、文書間の関連度に応じて文書を結合し、セグメントの見出し及びそれ以外の部分のそれぞれに対してインデックスを作成する(S305)。検索は2つのインデックスに対して行い、インデックスに対する検索結果に重み付けをつけて適合度を算出し、この適合度によって判定した検索結果をセグメント単位で出力する。
Claim (excerpt):
文書中に、当該文書を処理する装置がコマンドとして解釈可能な文字が含まれる被検索文書の検索用インデックスを作成するインデックス作成装置であって、前記被検索文書を保持する被検索文書保持手段と、該被検索文書保持手段に保持されている前記被検索文書から、前記コマンドとして解釈可能な文字に応じて第1次セグメントを抽出する文書分割手段と、前記第1次セグメントをその関連性に応じて統合し、第2次セグメントとする結束性処理手段と、前記第2次セグメントのそれぞれについて前記検索用インデックスを作成するインデックス作成手段と、を有することを特徴とするインデックス作成装置。
FI (3):
G06F 15/40 370 A ,  G06F 15/401 310 Z ,  G06F 15/413 310 Z
Patent cited by the Patent:
Cited by examiner (6)
Show all
Article cited by the Patent:
Return to Previous Page