特許
J-GLOBAL ID:200903027452509661
文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
発明者:
,
出願人/特許権者:
代理人 (1件):
酒井 昭徳
公報種別:公開公報
出願番号(国際出願番号):特願2002-211112
公開番号(公開出願番号):特開2004-054588
出願日: 2002年07月19日
公開日(公表日): 2004年02月19日
要約:
【課題】検索者にとって重要である可能性の高い文書を優先的に検索者に提示すること。【解決手段】検索実行部204内の合致度算出部204aは、収集文書保存部202に蓄積された個々の文書(ホームページ)につき、要求入力受付部203から入力した検索条件に対するその合致度をベクトル空間法により算出する。つぎに合致度補正部204bは、各文書のURL、位置する階層、タイトルや本文中の強調文字列、外部ページからの被参照頻度や内部ページへの参照頻度、参照元のアンカーテキストなどといった種々の属性に鑑みて、合致度算出部204aにより算出された合致度を補正する。たとえば、同一サーバ内の他の文書に多くリンクしている文書、リンク元のアンカーテキストに検索条件と同一または類似のキーワードを含む文書などについて、算出済みの合致度をより高い割合で水増しする、など。【選択図】 図2
請求項(抜粋):
複数の電子文書を各文書の検索条件に対する合致度にもとづいて順位づけする文書検索装置において、
前記各文書の属性情報を抽出する属性情報抽出手段と、
前記各文書の本文の前記検索条件に対する合致度を算出する合致度算出手段と、
前記合致度算出手段により算出された合致度を、前記属性情報抽出手段により抽出された各文書の属性情報にもとづいて補正する合致度補正手段と、
を備えたことを特徴とする文書検索装置。
IPC (1件):
FI (3件):
G06F17/30 350C
, G06F17/30 170A
, G06F17/30 419B
Fターム (11件):
5B075ND03
, 5B075ND36
, 5B075NK02
, 5B075NK04
, 5B075NK46
, 5B075PP02
, 5B075PP03
, 5B075PQ02
, 5B075PQ74
, 5B075PR06
, 5B075QM08
引用特許: