特許
J-GLOBAL ID:200903089648945902

キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 宮田 金雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-210252
公開番号(公開出願番号):特開平11-053384
出願日: 1997年08月05日
公開日(公表日): 1999年02月26日
要約:
【要約】【課題】 従来の自動キーワード抽出は、処理対象文中の文字列をそのままキーワードとして文書に索引づけするため、異表記に対処した検索が不可能である。【解決手段】 正表記と異表記を共に表記した専門語が格納された専門語格納手段と一般的で使用頻度の高い基本語が格納された基本語格納手段を備え、専門語分割点設定手段で入力文章中の、専門語格納手段にある専門語の範囲を切り出し、この専門語が、異表記の場合、正表記置換手段で正表記に置換し、字種分割点設定手段で、入力文章中の字種の違いを検出し、基本語分割点設定手段で入力された文章中で基本語格納手段中の基本語の範囲を切り出し、専門語分割点設定手段と字種分割点設定手段及び基本語分割点設定手段によって設定された分割点から部分文字列をキーワードとして切り出す部分文字列切出手段を備えた。
請求項(抜粋):
正表記と異表記とを共に表記した専門語が格納された専門語格納手段と、一般的で使用頻度の高い語が基本語として格納された基本語格納手段と、文章を入力する入力手段と、上記入力手段によって入力された文章中に、上記専門語格納手段に登録された専門語が存在する場合、上記文章中でその専門語の範囲を切り出す専門語分割点設定手段と、上記専門語分割点設定手段によって切り出された専門語が、異表記である場合、正表記に置換する正表記置換手段と、入力された文章中の字種の違いを検出する字種分割点設定手段と、入力された文章中で基本語格納手段中の基本語の範囲を切り出す基本語分割点設定手段と、上記専門語分割点設定手段と字種分割点設定手段及び基本語分割点設定手段によって設定された分割点から部分文字列を切り出す部分文字列切出手段と、上記部分文字列切出手段によって切り出された文字列をキーワードとして出力する出力手段とを備えたキーワード抽出装置。
FI (2件):
G06F 15/401 310 A ,  G06F 15/403 320 D
引用特許:
審査官引用 (7件)
全件表示

前のページに戻る