特許
J-GLOBAL ID:200903034796254243
情報処理装置
発明者:
,
,
,
,
出願人/特許権者:
代理人 (1件):
渡部 敏彦
公報種別:公開公報
出願番号(国際出願番号):特願平7-291663
公開番号(公開出願番号):特開平9-114840
出願日: 1995年10月16日
公開日(公表日): 1997年05月02日
要約:
【要約】【課題】 文書の内容を表現するために用いるキーワードとしての複合語を適切に抽出することができる情報処理装置を提供する。【解決手段】 文書データベース11に保持されている全ての文書の各文が形態素解析され、各単語・複合語のリストが作成され(ステップS1)、作成されたリストから各単語・複合語の文中における出現頻度を示す頻度データが作成される(ステップS3)。この頻度データから各複合語の重要度が算出され(ステップS5)、算出された各複合語の重要度が予め設定された閾値を越える場合には、その複合語を文書の内容を表現するためのキーワードとして認定する(ステップS6)。
請求項(抜粋):
文書を保持する文書データベースと、該文書データベースに保持された文書から単語・複合語を抽出し、該抽出した単語・複合語のリストを作成するリスト作成手段と、該リスト作成手段により作成された単語・複合語のリストに基づいて各単語・複合語の出現頻度を算出する出現頻度算出手段と、該出現頻度算出手段により算出された各単語・複合語の出現頻度に基づいて各複合語の重要度を算出する重要度算出手段と、該重要度算出手段により算出された各複合語の重要度に応じて、その複合語を文書内容の表現に用いるキーワードとして認定する複合語キーワード認定手段とを備えたことを特徴とする情報処理装置。
前のページに戻る