Pat
J-GLOBAL ID:200903058708363530

情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法

Inventor:
Applicant, Patent owner:
Agent (1): 酒井 宏明
Gazette classification:公開公報
Application number (International application number):2005009322
Publication number (International publication number):2006004399
Application date: Jan. 17, 2005
Publication date: Jan. 05, 2006
Summary:
【課題】正解データを用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出装置で、正解データの作成負担を軽減し、情報抽出精度を向上すること。【解決手段】拡張対象選択部120が正解データ記憶部110から拡張する正解データを選択し、正解拡張部130が正解データを拡張して拡張データを生成し、妥当性判定部140が規則学習部150に拡張データと正解データを学習させ、抽出部170にテストデータを使って情報抽出を実行させて結果を評価し、評価結果が拡張データの追加前に比べて良くなった場合には、拡張データを正解データとするよう構成する。【選択図】 図1
Claim (excerpt):
正解データを用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出プログラムであって、 正解データを拡張して新たな正解データである拡張データを生成する正解拡張手順と、 前記正解拡張手順により生成された拡張データを用いて情報抽出規則を学習する規則学習手順と、 をコンピュータに実行させることを特徴とする情報抽出プログラム。
IPC (1):
G06F 17/30
FI (2):
G06F17/30 220Z ,  G06F17/30 170A
F-Term (6):
5B075ND03 ,  5B075NK32 ,  5B075NR12 ,  5B075NS10 ,  5B075QP01 ,  5B075UU06
Patent cited by the Patent:
Cited by applicant (6)
Show all
Cited by examiner (6)
Show all
Article cited by the Patent:
Cited by applicant (1)
  • 複数の新聞を使用した言い替え表現の自動抽出
Cited by examiner (1)
  • 複数の新聞を使用した言い替え表現の自動抽出

Return to Previous Page