特許
J-GLOBAL ID:200903046309827967
情報抽出装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
守山 辰雄
公報種別:公開公報
出願番号(国際出願番号):特願平9-166516
公開番号(公開出願番号):特開平10-340275
出願日: 1997年06月09日
公開日(公表日): 1998年12月22日
要約:
【要約】【課題】 複数の文書から話題を抽出するだけでなく、更に、話題をより有効的に利用するための種々の情報を抽出することのできる情報抽出装置を提供する。【解決手段】 単語解析部2及び話題解析部4が文書データベース1に保持された複数の文書に含まれる特定の語句の時間的な分布を文書の更新日時に基づいて検出して、分布の強度が高い語句を話題語句として抽出し、話題カテゴリ解析部6が話題語句と同一文書に含まれる他の語句をカテゴリ語句として抽出し、話題カテゴリ記憶部7が話題語句をカテゴリ語句を用いて分類して管理する。また、話題評価解析部9が話題語句と同一文書に含まれる評価キーワード記憶部8に保持されたキーワードと同一のキーワードを検出し、話題評価記憶部が話題語句と検出されたキーワードとを対応付けて管理する。したがって、複数の話題語句をカテゴリ語句によって関連付けて抽出することができ、また、話題語句に対する評価を表しているキーワードを抽出することができる。
請求項(抜粋):
文書を当該文書の更新日時に関する情報とともに保持する文書データベースと、文書データベースに保持された複数の文書に含まれる特定の語句の時間的な分布を文書の更新日時に基づいて検出して、分布の強度が高い語句を話題語句として抽出する話題語句抽出手段と、話題語句と同一文書に含まれる他の語句をカテゴリ語句として抽出する話題カテゴリ抽出手段と、話題語句をカテゴリ語句を用いて分類して管理する話題管理手段と、を備えたことを特徴とする情報抽出装置。
FI (2件):
G06F 15/401 310 A
, G06F 15/401 320 A
前のページに戻る