Pat
J-GLOBAL ID:200903008521816461
キーワード抽出方式
Inventor:
Applicant, Patent owner:
Agent (1):
京本 直樹 (外2名)
Gazette classification:公開公報
Application number (International application number):1992173941
Publication number (International publication number):1994019970
Application date: Jul. 01, 1992
Publication date: Jan. 28, 1994
Summary:
【要約】【目的】キーワードを公正に効率良く抽出できるようにする。【構成】入力手段1はOCR等を利用し図や表等を除いた活字部分を読み出し可能な形式へ変換する。データ抽出部12は入力手段1からデータを読み出し予め備えた辞書及び予め定められた種類のストップワードからキーワード候補を出力する。データ保守部13は抽出されたキーワード候補に関しデータ保持部5を検索しデータ保持部に存在しなければキーワード候補をデータ保持部に新たに格納し、存在すればキーワード候補の出現回数カウンタを1増加させる。出力部14は抽出されたキーワード候補の出現回数カウンタの値が予め決められた値以上のキーワード候補をキーワードとして出力する。
Claim (excerpt):
情報検索システムにおけるキーワード抽出方式において、OCR等を利用し図や表等を除いた活字部分を読み出し可能な形式へ変換する入力手段と、前記入力手段からデータを読み出し予め備えた辞書及び予め定められた種類のストップワードからキーワード候補を出力するデータ抽出部と、抽出された前記キーワード候補に関し予め備えたデータ保持部を検索し前記データ保持部に存在しなければ前記キーワード候補を前記データ保持部に新たに格納し存在すれば前記キーワード候補の出現回数カウンタを1増加させるデータ保守部と、抽出された前記キーワード候補の前記出現回数カウンタの値が予め決められた値以上の前記キーワード候補をキーワードとして出力する出力手段を備えたことを特徴とするキーワード抽出方式。
IPC (2):
G06F 15/40 500
, G06F 15/20 550
Return to Previous Page