Pat
J-GLOBAL ID:200903041512504772
情報抽出装置及びその方法並びに情報記憶媒体
Inventor:
Applicant, Patent owner:
Agent (1):
工藤 宣幸
Gazette classification:公開公報
Application number (International application number):1998071804
Publication number (International publication number):1999272695
Application date: Mar. 20, 1998
Publication date: Oct. 08, 1999
Summary:
【要約】【課題】 抽出対象となる文中に未知語が含まれている場合、正しい情報の抽出を行えない。【解決手段】 自然言語で記述された文書より、必要な情報を抽出する情報抽出装置に、(1) ある種の情報の表現に特徴的に現れる1又は複数の文字パターンと、文書中に現れる文字列とを逐次照合し、一致が認められた文字列部分に対し、一致した文字パターンの属性を示すタグ情報を付与する文字パターン処理部と、(2) タグ情報はそのままに、タグ情報を除く他の文字列部分を逐次単語情報に分割する形態素解析処理部とを備えるようにする。
Claim (excerpt):
自然言語で記述された文書より、必要な情報を抽出する情報抽出装置において、ある種の情報の表現に特徴的に現れる1又は複数の文字パターンと、文書中に現れる文字列とを逐次照合し、一致が認められた文字列部分に対し、一致した文字パターンの属性を示すタグ情報を付与する文字パターン処理部と、上記タグ情報はそのままに、タグ情報を除く他の文字列部分を逐次単語情報に分割する形態素解析処理部とを備えたことを特徴とする情報抽出装置。
IPC (2):
FI (4):
G06F 15/40 370 A
, G06F 15/38 J
, G06F 15/38 E
, G06F 15/40 340
Patent cited by the Patent:
Cited by examiner (3)
-
固有名詞特定処理システム
Gazette classification:公開公報
Application number:特願平4-172176
Applicant:エヌ・ティ・ティ・データ通信株式会社
-
固有名詞特定方法
Gazette classification:公開公報
Application number:特願平5-143963
Applicant:エヌ・ティ・ティ・データ通信株式会社
-
同義語情報作成装置
Gazette classification:公開公報
Application number:特願平5-054399
Applicant:株式会社東芝
Return to Previous Page