Pat
J-GLOBAL ID:200903019845316374

キーワード付与システム

Inventor:
Applicant, Patent owner:
Agent (1): 笹岡 茂 (外1名)
Gazette classification:公開公報
Application number (International application number):1993172464
Publication number (International publication number):1995078182
Application date: Jun. 18, 1993
Publication date: Mar. 20, 1995
Summary:
【要約】【目的】 複数の分野の文書データと、分野内での各単語の出現頻度を利用し、大半のキーワードを自動的に抽出し付与するシステムを提供することにある。【構成】 各文書データaを単語分割し(1)、テーブル(b)に格納し、各文書データ内の各単語の出現回数を検出し(2)、テーブル(c)に登録し、該テーブル(c)に基づき各分野における単語の出現頻度を求めて分野別出現単語集計テーブルに登録し(3)、該集計テーブルの出現頻度を基に文書データから分野別のキーワードを抽出し(4)、また分野別のキーワードとなりえない不要語を抽出し(5)、抽出した分野別のキーワードと不要語をキーワード・不要語辞書(d)に登録し、文書データにキーワードを付与する際、前記辞書(d)に登録されたキーワードと不要語を参照し、キーワードを付与する文書データ中の単語からキーワードとなる単語を抽出し、抽出したキーワードを該文書データに付与(7)している。
Claim (excerpt):
入出力装置と、記憶装置と、プロセッサを備え、分野別の文書データからキーワードとなる語を抽出し、該文書データに付与するキーワード付与システムにおいて、前記プロセッサは、複数の各文書データ内の各単語の出現回数を検出し、単語出現頻度テーブルに登録する手段と、該単語出現頻度テーブルに基づき各分野における単語の出現頻度を求め、分野別出現単語集計テーブルに登録する手段と、該分野別出現単語集計テーブルの出現頻度を基に文書データから分野別のキーワードを抽出する手段と、該分野別出現単語集計テーブルの出現頻度を基に文書データから分野別のキーワードとなりえない不要語を抽出する手段と、前記抽出した分野別のキーワードと分野別の不要語をキーワード・不要語辞書に登録する手段と、文書データにキーワードを付与する際、前記辞書に登録されたキーワードと不要語を参照し、キーワードを付与する文書データ中の単語からキーワードとなる単語を抽出し、抽出したキーワードを該文書データに付与するキーワード付与手段を備えることを特徴とするキーワード付与システム。
IPC (2):
G06F 17/30 ,  G06F 12/00 520
FI (2):
G06F 15/40 500 T ,  G06F 15/40 500 U
Patent cited by the Patent:
Cited by examiner (3)
  • 特開昭57-182279
  • 特開平1-112331
  • 特開平2-148265

Return to Previous Page