特許
J-GLOBAL ID:200903050697290195

キーワード自動抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-158293
公開番号(公開出願番号):特開平7-036917
出願日: 1993年06月29日
公開日(公表日): 1995年02月07日
要約:
【要約】【目的】 数量のキーワード抽出効率を向上させる。【構成】 形態素解析手段1-1は、解析用辞書1-7を用いて日本語のテキストデータを形態素に分割する。形態素辞書情報展開手段1-2は、形態素辞書1-8を用いて分割された各形態素に対しての品詞情報を展開する。数詞・単位列抽出手段1-3は、品詞が数詞と単位で構成されている形態素列を抽出する。数量認識手段1-4は、予め規定したパターンで連続している形態素列を数量として認識する。数量判別手段1-5は、数量と認識された形態素列が連続しているものについて1つの数量を表しているか別々の数量を表しているかを判別する。数量抽出手段1-6は、判別された数量のうち数量抽出指定テーブル1-9で指定された単位を有する数量をキーワードとして抽出する。
請求項(抜粋):
情報検索システムにおける情報の検索を行う場合に有効となるキーワードを日本語のテキストデータから自動抽出するキーワード自動抽出装置において、形態素単位の接続に関する情報を格納している解析用辞書と前記形態素ごとに品詞情報と単位種別情報を格納している形態素辞書と前記テキストデータにおける数字と単位を表す英小文字で構成されている数量のうち抽出したい前記数量の単位を格納している数量抽出指定テーブルを予め備え、前記解析用辞書を用いて日本語の前記テキストデータを形態素に分割する形態素解析手段と、前記形態素辞書を用いて前記分割された各形態素に対しての品詞情報を展開する形態素辞書情報展開手段と、前記品詞が数詞と単位で構成されている形態素列を抽出する数詞・単位列抽出手段と、予め規定したパターンで連続している前記形態素列を数量として認識する数量認識手段と、前記数量と認識された形態素列が連続しているものについて1つの前記数量を表しているか別々の前記数量を表しているかを判別する数量判別手段と、前記判別された数量のうち前記数量抽出指定テーブルで指定された前記単位を有する前記数量を前記キーワードとして抽出する数量抽出手段とを備えたことを特徴とするキーワード自動抽出装置。
引用特許:
審査官引用 (3件)
  • 特開昭63-228326
  • 特開昭63-089976
  • 特開昭63-220360

前のページに戻る