特許
J-GLOBAL ID:200903041512504772
情報抽出装置及びその方法並びに情報記憶媒体
発明者:
出願人/特許権者:
代理人 (1件):
工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願平10-071804
公開番号(公開出願番号):特開平11-272695
出願日: 1998年03月20日
公開日(公表日): 1999年10月08日
要約:
【要約】【課題】 抽出対象となる文中に未知語が含まれている場合、正しい情報の抽出を行えない。【解決手段】 自然言語で記述された文書より、必要な情報を抽出する情報抽出装置に、(1) ある種の情報の表現に特徴的に現れる1又は複数の文字パターンと、文書中に現れる文字列とを逐次照合し、一致が認められた文字列部分に対し、一致した文字パターンの属性を示すタグ情報を付与する文字パターン処理部と、(2) タグ情報はそのままに、タグ情報を除く他の文字列部分を逐次単語情報に分割する形態素解析処理部とを備えるようにする。
請求項(抜粋):
自然言語で記述された文書より、必要な情報を抽出する情報抽出装置において、ある種の情報の表現に特徴的に現れる1又は複数の文字パターンと、文書中に現れる文字列とを逐次照合し、一致が認められた文字列部分に対し、一致した文字パターンの属性を示すタグ情報を付与する文字パターン処理部と、上記タグ情報はそのままに、タグ情報を除く他の文字列部分を逐次単語情報に分割する形態素解析処理部とを備えたことを特徴とする情報抽出装置。
IPC (2件):
FI (4件):
G06F 15/40 370 A
, G06F 15/38 J
, G06F 15/38 E
, G06F 15/40 340
引用特許:
審査官引用 (3件)
-
固有名詞特定処理システム
公報種別:公開公報
出願番号:特願平4-172176
出願人:エヌ・ティ・ティ・データ通信株式会社
-
固有名詞特定方法
公報種別:公開公報
出願番号:特願平5-143963
出願人:エヌ・ティ・ティ・データ通信株式会社
-
同義語情報作成装置
公報種別:公開公報
出願番号:特願平5-054399
出願人:株式会社東芝
前のページに戻る