Pat
J-GLOBAL ID:200903058708363530
情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
Inventor:
Applicant, Patent owner:
Agent (1):
酒井 宏明
Gazette classification:公開公報
Application number (International application number):2005009322
Publication number (International publication number):2006004399
Application date: Jan. 17, 2005
Publication date: Jan. 05, 2006
Summary:
【課題】正解データを用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出装置で、正解データの作成負担を軽減し、情報抽出精度を向上すること。【解決手段】拡張対象選択部120が正解データ記憶部110から拡張する正解データを選択し、正解拡張部130が正解データを拡張して拡張データを生成し、妥当性判定部140が規則学習部150に拡張データと正解データを学習させ、抽出部170にテストデータを使って情報抽出を実行させて結果を評価し、評価結果が拡張データの追加前に比べて良くなった場合には、拡張データを正解データとするよう構成する。【選択図】 図1
Claim (excerpt):
正解データを用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出プログラムであって、
正解データを拡張して新たな正解データである拡張データを生成する正解拡張手順と、
前記正解拡張手順により生成された拡張データを用いて情報抽出規則を学習する規則学習手順と、
をコンピュータに実行させることを特徴とする情報抽出プログラム。
IPC (1):
FI (2):
G06F17/30 220Z
, G06F17/30 170A
F-Term (6):
5B075ND03
, 5B075NK32
, 5B075NR12
, 5B075NS10
, 5B075QP01
, 5B075UU06
Patent cited by the Patent:
Cited by examiner (6)
-
意味解析装置、意味解析方法、意味解析プログラム、及び該プログラムを記録した記録媒体
Gazette classification:公開公報
Application number:特願2002-265232
Applicant:日本放送協会
-
文字処理装置および文字処理方法
Gazette classification:公開公報
Application number:特願平7-093507
Applicant:キヤノン株式会社
-
事例蓄積装置および方法
Gazette classification:公開公報
Application number:特願2001-019565
Applicant:富士通株式会社
-
用語集生成装置及び用語集生成プログラム並びに用語集検索装置
Gazette classification:公開公報
Application number:特願2001-289477
Applicant:日本放送協会
-
言語処理方法、プログラム及び装置
Gazette classification:公開公報
Application number:特願2002-252475
Applicant:富士通株式会社
-
テキスト処理方法
Gazette classification:公開公報
Application number:特願2001-139563
Applicant:独立行政法人通信総合研究所
Show all
Article cited by the Patent:
Return to Previous Page