特許
J-GLOBAL ID:200903008521816461

キーワード抽出方式

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-173941
公開番号(公開出願番号):特開平6-019970
出願日: 1992年07月01日
公開日(公表日): 1994年01月28日
要約:
【要約】【目的】キーワードを公正に効率良く抽出できるようにする。【構成】入力手段1はOCR等を利用し図や表等を除いた活字部分を読み出し可能な形式へ変換する。データ抽出部12は入力手段1からデータを読み出し予め備えた辞書及び予め定められた種類のストップワードからキーワード候補を出力する。データ保守部13は抽出されたキーワード候補に関しデータ保持部5を検索しデータ保持部に存在しなければキーワード候補をデータ保持部に新たに格納し、存在すればキーワード候補の出現回数カウンタを1増加させる。出力部14は抽出されたキーワード候補の出現回数カウンタの値が予め決められた値以上のキーワード候補をキーワードとして出力する。
請求項(抜粋):
情報検索システムにおけるキーワード抽出方式において、OCR等を利用し図や表等を除いた活字部分を読み出し可能な形式へ変換する入力手段と、前記入力手段からデータを読み出し予め備えた辞書及び予め定められた種類のストップワードからキーワード候補を出力するデータ抽出部と、抽出された前記キーワード候補に関し予め備えたデータ保持部を検索し前記データ保持部に存在しなければ前記キーワード候補を前記データ保持部に新たに格納し存在すれば前記キーワード候補の出現回数カウンタを1増加させるデータ保守部と、抽出された前記キーワード候補の前記出現回数カウンタの値が予め決められた値以上の前記キーワード候補をキーワードとして出力する出力手段を備えたことを特徴とするキーワード抽出方式。
IPC (2件):
G06F 15/40 500 ,  G06F 15/20 550

前のページに戻る