特許
J-GLOBAL ID:200903039742980439

文書検索装置及び文書検索方法

発明者:
出願人/特許権者:
代理人 (1件): 長谷川 芳樹 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-202561
公開番号(公開出願番号):特開2002-024280
出願日: 2000年07月04日
公開日(公表日): 2002年01月25日
要約:
【要約】【課題】 検索対象となる複数の検索対象文書から、基準となる基準文書に近い内容の文書を検索する文書検索装置を提供する。【解決手段】 本発明に係る文書検索装置10は、基準文書に含まれる複数のキーワードと、それぞれのキーワードが基準文書に固有に含まれる程度を示す評価値とを格納した評価値DB43を備え、検索対象文書に含まれるキーワードの評価値を評価値DB43に基づいて集計して集計値を求め、集計値を当該検索対象文書に含まれるキーワード数で除することによって、当該検索対象文書の文書評価値を求める。そして、文書評価値とあらかじめ設定された基準値とを比較し、文書評価値が基準値より大きい検索対象文書を基準文書に内容の近い文書として抽出する。
請求項(抜粋):
検索対象となる複数の検索対象文書から、基準となる基準文書に近い内容の文書を検索する文書検索装置であって、前記基準文書に含まれる複数のキーワードと、それぞれの前記キーワードが前記基準文書に固有に含まれる程度を示す評価値とを格納した評価値格納手段と、複数の前記検索対象文書に含まれるすべてのワードを検索ワードとして抽出する検索ワード抽出手段と、前記検索ワード抽出手段によって抽出された前記検索ワードを抽出元の前記検索対象文書を特定する検索対象文書コードに関連付けて格納する検索ワード格納手段と、前記検索ワード格納手段に格納された前記検索ワードと前記評価値格納手段に格納された前記キーワードとを照合し、前記検索ワードと前記キーワードとが一致する場合に前記検索ワードに前記キーワードの前記評価値を付与し、前記検索ワードに付与された前記評価値を前記検索対象文書コードに基づいて集計して前記検索対象文書毎の集計値を算出する評価値集計手段と、前記評価値集計手段によって算出されたそれぞれの前記検索対象文書における評価値の前記集計値を、前記検索対象文書に含まれる前記キーワードの数で除してそれぞれの前記検索対象文書の文書評価値を算出する文書評価値算出手段と、前記文書評価値算出手段によって算出された前記文書評価値とあらかじめ設定された基準値とを比較し、前記基準値より大きい前記文書評価値を有する前記検索対象文書を抽出する検索文書抽出手段と、を備えることを特徴とする文書検索装置。
IPC (3件):
G06F 17/30 340 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3件):
G06F 17/30 340 B ,  G06F 17/30 170 A ,  G06F 17/30 210 A
Fターム (4件):
5B075ND03 ,  5B075NK31 ,  5B075PR04 ,  5B075UU06
引用特許:
審査官引用 (1件)

前のページに戻る