特許
J-GLOBAL ID:200903043332311278

類似文書検索方法および類似文書検索装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-002747
公開番号(公開出願番号):特開平10-198690
出願日: 1997年01月10日
公開日(公表日): 1998年07月31日
要約:
【要約】【課題】 不要語なキーワードによるノイズを排除して検索の精度を向上させることができるようにする。また、検索対象を絞り込むことができるようにするによって、検索の能率を向上させる。【解決手段】 検索質問ベクトルの生成時に、キーワードとしての不要語を指定することができるようにし、その不要語を考慮した類似度を計算して検索を行うことができるようにする。また前回の検索結果を絞り込みデータとして一時的に保存しておき、次回の検索のとき、絞り込み指定部によって絞り込みデータの中の上位何件かを指定することによって検索対象を絞り込む。
請求項(抜粋):
事例データベースに事例となる文書を格納しておき、検索のときにキーワードとなる単語およびその同義語をキーワード辞書に登録しておき、前記事例データベース中の全事例文書における前記キーワードの出現頻度と前記キーワードの出現する事例文書の頻度とを出現頻度データとして事例頻度データ部に記憶しておき、前記事例データベースに格納されている全事例文書のそれぞれの事例文書に対して前記キーワード辞書を参照してキーワードを抽出して抽出したキーワードについて前記事例頻度データ部の前記出現頻度データからあらかじめ事例ベクトルを生成しておき、マウスおよびキーボードおよびディスプレイを有する検索質問入力部から入力した検索質問文書について利用者が不要であると指定したキーワードを除外したキーワードを前記キーワード辞書を参照して抽出して抽出したキーワードについて前記事例頻度データ部の出現頻度データから検索質問ベクトルを生成し、前記検索質問ベクトルと前記事例ベクトルとから所定の計算式によって前記事例データベースの全事例文書のそれぞれの事例文書について類似度を計算し、前記類似度の計算結果によって前記類似度の高い順に前記事例文書を並べた検索結果データを生成することを含むことを特徴とする類似文書検索方法。
FI (3件):
G06F 15/403 340 B ,  G06F 15/40 380 A ,  G06F 15/403 350 C
引用特許:
審査官引用 (3件)
  • 文章検索装置
    公報種別:公開公報   出願番号:特願平4-166259   出願人:シャープ株式会社
  • 情報検索用端末装置
    公報種別:公開公報   出願番号:特願平3-203469   出願人:株式会社日立製作所
  • 特開昭64-046831

前のページに戻る