Pat
J-GLOBAL ID:200903065703893686

文書検索方法及び装置及び文書検索プログラム

Inventor:
Applicant, Patent owner:
Agent (1): 伊東 忠彦
Gazette classification:公開公報
Application number (International application number):2002311698
Publication number (International publication number):2004145753
Application date: Oct. 25, 2002
Publication date: May. 20, 2004
Summary:
【課題】ある文書と同じ問題・事件などを扱う一連の文書を検索する際に、その文書がどのような問題・事件に関する文書なのかを記述している文書を抽出し、話題の類似性に基づいて関連文書を検索する。【解決手段】本発明は、文書格納手段に格納されている文書から話題抽出用パターンを用いて話題や新情報を抽出し、文書のヘッドラインを生成し、各文書毎付与して文書格納手段に登録し、話題の類似性に基づいて、文書格納手段の処理対象文書と文書格納手段の他の文書の話題同士の関連度を計算し、関連度が閾値より大きい文書を関連文書とし、入力された文書IDまたは、検索語句に基づいて、話題抽出を行い、話題に基づいて関連文書を文書格納手段から検索する。【選択図】 図1
Claim (excerpt):
文書群からユーザが指定する文書と同じ話題の一連の文書を検索する文書検索方法において、 文書格納手段に格納されている文書から話題抽出用パターンを用いて、話題や当該文書で新たに伝えようとする新情報を抽出し、該文書のヘッドラインを生成して、各文書毎に該話題、該新情報及び該ヘッドラインを付与して、該文書格納手段に登録し、 前記文書の話題の類似性に基づいて、前記文書格納手段の処理対象文書と該文書格納手段の他の文書の話題同士の関連度を計算し、 計算された前記関連度が予め決められた閾値より大きい文書を関連文書とし、 ユーザから入力された文書IDに基づいて、該文書IDに対応する関連文書を前記文書格納手段から検索する、または、該ユーザから入力された検索語句に基づいて、話題抽出を行い、該話題に基づいて関連文書を該文書格納手段から検索することを特徴とする文書検索方法。
IPC (1):
G06F17/30
FI (3):
G06F17/30 220C ,  G06F17/30 170A ,  G06F17/30 350C
F-Term (14):
5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NK39 ,  5B075NR05 ,  5B075NS01 ,  5B075PP24 ,  5B075PQ46 ,  5B075PQ74 ,  5B075PQ76 ,  5B075PR01 ,  5B075PR06 ,  5B075QM08 ,  5B075UU06
Patent cited by the Patent:
Cited by examiner (8)
Show all

Return to Previous Page