特許
J-GLOBAL ID:200903053303705629

キーワード自動抽出装置およびキーワード自動抽出方法

発明者:
出願人/特許権者:
代理人 (1件): 長谷川 文廣 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-020971
公開番号(公開出願番号):特開平7-230468
出願日: 1994年02月18日
公開日(公表日): 1995年08月29日
要約:
【要約】【目的】 キーワードの品質および情報検索システムの検索精度を高めることを目的とする。【構成】 文字列6を、連続した同一の文字種からなる文字列要素(漢字文字列、カタカナ文字列、数字文字列など)に分割して文字列要素リスト7を作成し、この中で数字文字列やカタカナ文字列などのように形態素解析が行われない部分を、これに対応する文法情報を持った代替文字*などで置き換えたかたちの形態素解析用テキストを作成し、この形態素解析用テキストに形態素解析を実行して文字列要素の中の少なくとも漢字文字列を形態素に再分割した形態素解析リスト8を作成する。そして、この形態素解析リスト8の文法情報にもとづいて、文字列要素および形態素の中の名詞などと、もともと名詞同士などの所定の文法関係により隣接していたこれらの連語とからなるキーワードリスト9を作成する。
請求項(抜粋):
文字列の中の特定の文字種についてだけの形態素解析を実行することにより当該文字列のキーワードを求めるようにしたキーワード自動抽出装置であって、前記文字列を、連続した同一の文字種からなる文字列要素に分割する文字種区分け部と、前記形態素解析を実行して前記文字列要素の中の少なくとも漢字文字列を形態素に分割する形態素解析部と、前記文字列要素および前記形態素それぞれの文法情報にもとづいて、これらの中の名詞などの所定のものと、もともと名詞同士などの所定の文法関係により隣接していたこれらの連語とを、前記キーワードとして選択するキーワード抽出部とを備えたことを特徴とするキーワード自動抽出装置。
引用特許:
出願人引用 (2件) 審査官引用 (1件)
  • 特開平3-105465

前のページに戻る