Pat
J-GLOBAL ID:200903075619549959

自然言語の構文情報を利用した文書検索方法および文書検索システム

Inventor:
Applicant, Patent owner:
Agent (1): 笹岡 茂 (外1名)
Gazette classification:公開公報
Application number (International application number):1992177378
Publication number (International publication number):1993342255
Application date: Jun. 11, 1992
Publication date: Dec. 24, 1993
Summary:
【要約】【目的】 自然言語によるフルテキストサーチにおいて、異表記や類義語による検索漏れ及び指定文字列が偶然そろうことによる検索雑音を減少させる。【構成】 構文解析装置107は、検索条件文字列を構文解析装置で解析し文字列内の構文情報(単語の出現確度および単語間距離)を出力する。適合度計算装置108は、検索条件文字列内の構文情報を基に結合重みファイル106内の結合重みを用いて検索条件文字列単語間近接度を求め、文書データベース内の検索対象文の構文情報を基に結合重みを用いて検索対象文単語間近接度を求め、前記検索対象文単語間近接度と類義語辞書ファイル105内の単語間の連想強度とを基に連想単語間近接度を求め、前記検索条件文字列単語間近接度と連想単語間近接度とを基に結合重みを用いて単語対適合度を求め、求められた単語対ごとの単語対適合度を統合して検索対象文の適合度を求める。
Claim (excerpt):
自然言語の形で保存され、データベース内の全文を検索対象文とする文書データベースから、入力された検索条件文字列に適合する対象文を検索する文書検索方法において、入力された検索条件文字列の構文情報である検索条件文字列内の単語の出現確度および単語間距離を基に検索条件文字列単語間近接度を求める過程と、文書データベース内の検索対象文の構文情報である検索対象文内の単語の出現確度および単語間距離を基に検索対象文単語間近接度を求める過程と、該検索対象文単語間近接度と単語間の連想強度とを基に連想単語間近接度を求める過程と、前記検索条件文字列単語間近接度と連想単語間近接度とを基に単語対適合度を求める過程と、求められた単語対ごとの単語対適合度を統合して検索対象文の適合度を求める過程を備えることを特徴とする文書検索方法。
IPC (4):
G06F 15/38 ,  G06F 15/18 ,  G06F 15/40 500 ,  G06F 15/40 510

Return to Previous Page