特許
J-GLOBAL ID:200903019845316374
キーワード付与システム
発明者:
,
出願人/特許権者:
代理人 (1件):
笹岡 茂 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-172464
公開番号(公開出願番号):特開平7-078182
出願日: 1993年06月18日
公開日(公表日): 1995年03月20日
要約:
【要約】【目的】 複数の分野の文書データと、分野内での各単語の出現頻度を利用し、大半のキーワードを自動的に抽出し付与するシステムを提供することにある。【構成】 各文書データaを単語分割し(1)、テーブル(b)に格納し、各文書データ内の各単語の出現回数を検出し(2)、テーブル(c)に登録し、該テーブル(c)に基づき各分野における単語の出現頻度を求めて分野別出現単語集計テーブルに登録し(3)、該集計テーブルの出現頻度を基に文書データから分野別のキーワードを抽出し(4)、また分野別のキーワードとなりえない不要語を抽出し(5)、抽出した分野別のキーワードと不要語をキーワード・不要語辞書(d)に登録し、文書データにキーワードを付与する際、前記辞書(d)に登録されたキーワードと不要語を参照し、キーワードを付与する文書データ中の単語からキーワードとなる単語を抽出し、抽出したキーワードを該文書データに付与(7)している。
請求項(抜粋):
入出力装置と、記憶装置と、プロセッサを備え、分野別の文書データからキーワードとなる語を抽出し、該文書データに付与するキーワード付与システムにおいて、前記プロセッサは、複数の各文書データ内の各単語の出現回数を検出し、単語出現頻度テーブルに登録する手段と、該単語出現頻度テーブルに基づき各分野における単語の出現頻度を求め、分野別出現単語集計テーブルに登録する手段と、該分野別出現単語集計テーブルの出現頻度を基に文書データから分野別のキーワードを抽出する手段と、該分野別出現単語集計テーブルの出現頻度を基に文書データから分野別のキーワードとなりえない不要語を抽出する手段と、前記抽出した分野別のキーワードと分野別の不要語をキーワード・不要語辞書に登録する手段と、文書データにキーワードを付与する際、前記辞書に登録されたキーワードと不要語を参照し、キーワードを付与する文書データ中の単語からキーワードとなる単語を抽出し、抽出したキーワードを該文書データに付与するキーワード付与手段を備えることを特徴とするキーワード付与システム。
IPC (2件):
G06F 17/30
, G06F 12/00 520
FI (2件):
G06F 15/40 500 T
, G06F 15/40 500 U
引用特許:
審査官引用 (3件)
-
特開昭57-182279
-
特開平1-112331
-
特開平2-148265
前のページに戻る