特許
J-GLOBAL ID:200903020684948055

キーワード抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 井出 直孝 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-174292
公開番号(公開出願番号):特開平5-120345
出願日: 1991年05月31日
公開日(公表日): 1993年05月18日
要約:
【要約】【目的】 雑誌新聞記事データベース等で使用するキーワードを辞書をほとんど使用せずに自動抽出できるようにする。【構成】 対象とする記事全文の中から、主題に関係する重要語、重要文を抽出して、キーワードとしての条件を満たす単語をキーワードとして抽出する。またキーワードとして適当な、見出し行中の単語、本文中の単語、企業名・団体名等をキーワードとして抽出する。この抽出したキーワードから不要なキーワードを削除して確定したキーワードとする。さらに確定したキーワード中で記事の主題に関連する重要語である単語をキーワードとして関連する記事についてあらかじめ決めた範囲の期間の記事データベースを検索し関連する記事データベースのキーワード群を取り出す。このキーワード群の中で出現頻度が高く、上述の確定したキーワードにないものを想像キーワードとして付加する。
請求項(抜粋):
対象とする文章全文からあらかじめ定められたキーワード抽出条件に基づいて単語を切り出すキーワード抽出手段を備えたキーワード抽出装置において、上記キーワード抽出手段は、対象とする文章の主題を表現する重要語を抽出する手段を含み、この重要語をキーワードとしてあらかじめ定めた所定期間内のデータベースを検索して対象とする文章に関係する書誌データを抽出し、この抽出した書誌データのキーワード群中でその出現頻度が高く上記キーワード抽出手段でキーワードとして抽出されていないキーワードを対象とする文章にキーワードとして付与する手段を備えたことを特徴とするキーワード抽出装置。
引用特許:
審査官引用 (2件)
  • 特開平1-112331
  • 特開平2-244274

前のページに戻る