特許
J-GLOBAL ID:201103024575253253
情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
発明者:
出願人/特許権者:
代理人 (1件):
酒井 宏明
公報種別:特許公報
出願番号(国際出願番号):特願2005-009322
公開番号(公開出願番号):特開2006-004399
特許番号:特許第4347226号
出願日: 2005年01月17日
公開日(公表日): 2006年01月05日
請求項(抜粋):
【請求項1】 正解データである文を用いた機械学習によって得られる情報抽出規則に基づいてテキストから情報を抽出する情報抽出プログラムであって、
前記文を記憶装置から読み出し、該読み出した文の構文解析結果に基づいて同じ係り先の複数の係り元の語順を入れ換えることによって正解データを拡張して新たな正解データである拡張データを生成する正解拡張手順と、
前記正解拡張手順により生成された拡張データを追加して機械学習を行い、テストデータを用いて学習結果を評価し、拡張データを追加する前と比較して評価結果が向上するか否かによって、拡張データの正当性を評価し、正当であると評価した拡張データを前記記憶装置に追加する正当性評価手順と、
前記正当性評価手順により正当であると評価された拡張データを前記記憶装置から読み出し、該読み出した拡張データの拡張部分を強調して表示装置に表示する強調表示手順と、
前記正当性評価手順により正当であると評価された拡張データを含む正解データを前記記憶装置から読み出して情報抽出規則を学習する規則学習手順と、
をコンピュータに実行させることを特徴とする情報抽出プログラム。
IPC (1件):
FI (2件):
G06F 17/30 220 Z
, G06F 17/30 170 A
引用特許:
引用文献:
前のページに戻る