特許
J-GLOBAL ID:200903036028231547

文章検索装置

発明者:
出願人/特許権者:
代理人 (1件): 深見 久郎
公報種別:公開公報
出願番号(国際出願番号):特願平4-166259
公開番号(公開出願番号):特開平6-004584
出願日: 1992年06月24日
公開日(公表日): 1994年01月14日
要約:
【要約】【目的】 この発明の目的は、検索者の装置利用時の負担を軽減し、検索精度を向上させることのできる文章検索装置を提供することである。【構成】 この検索装置は検索要求入力部1、重要語抽出部2、複数文字列検索部4、重み修正部6、レコード評価表示部7を含む。検索者が入力部1を介して検索要求テキストを入力すると、抽出部2および修正部6は該テキストから検索重要語を抽出するとともに、各重要語の重みを検索対象テキストにおいてまんべんに使用されるものは低く、偏って使用されるものについては高くなるように設定する。次に、検索部4および表示部7は検索対象テキスト中の各レコードにおける各重要語の使用頻度のベクトルと各重要語の重みのベクトルとの距離(類似度)に基づいて検索対象テキストから高類似度のレコードを抽出するので、検索要求に内容的に関連したレコードが簡単かつ精度よく得られる。
請求項(抜粋):
少なくとも1つ以上の文字列を含み、かつ複数のレコードからなるテキストを対象にして検索処理する文章検索装置において、前記複数レコードから所望レコードの検索を要求するための文字列からなるテキストを入力するための入力手段と、前記入力手段から入力された検索要求テキストから前記検索処理において重要となる少なくとも1つ以上の単語を抽出し、抽出された各重要語の該検索要求テキストにおける使用頻度に基づいてその重みを設定する重要語抽出手段と、前記検索対象テキスト中の各レコードにおける前記各重要語の使用頻度を計数する頻度計数手段と、前記重要語抽出手段により設定された各重要語の重みを、各重要語の前記検索対象テキスト中での使用率の逆数に基づいて修正する重み修正手段と、前記重み修正手段により修正された各重要語の重みのベクトルと前記頻度計数手段により計数された前記各レコードにおける各重要語の使用頻度のベクトルとの距離に基づいて前記各レコードが前記所望レコードである度合を評価するレコード評価手段と、前記レコード評価手段により評価された前記各レコードの前記度合に基づいて、前記各レコードから前記所望レコードの候補となるレコードを抽出して出力する出力手段とを備えた、文章検索装置。

前のページに戻る