特許
J-GLOBAL ID:201703011980256642

情報抽出方法、情報抽出装置及び情報抽出プログラム

発明者:
出願人/特許権者:
代理人 (2件): 三好 秀和 ,  工藤 理恵
公報種別:特許公報
出願番号(国際出願番号):特願2013-106917
公開番号(公開出願番号):特開2014-228993
特許番号:特許第6059598号
出願日: 2013年05月21日
公開日(公表日): 2014年12月08日
請求項(抜粋):
【請求項1】 関連性のあるカテゴリそれぞれの候補を文書情報から抽出して格納した抽出候補記憶手段と、 文書情報から抽出した前記候補のうち、当該候補が同じカテゴリの別の候補の部分文字列となっている場合に、前記別の候補の文字数に対する当該候補の文字数の割合が予め設定した除去比率に満たないときは当該候補を除去する候補除去手段と、 カテゴリそれぞれの正解を格納した正解記憶手段と、 関連性のあるカテゴリの情報を抽出するための抽出モデルを格納する抽出モデル記憶手段と、 前記抽出候補記憶手段に格納されたカテゴリそれぞれの候補の全ての可能な組み合わせに対して、当該組み合わせの特徴を表す特徴ベクトルを計算する特徴ベクトル計算手段と、 前記抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得する組み合わせ取得手段と、 前記正解記憶手段から前記正解の組み合わせを読み出してスコアを計算し、前記正解の組み合わせのスコアに対する前記組み合わせ取得手段が取得した組み合わせのスコアの損失が所定の範囲内の場合は、前記抽出モデル記憶手段に格納された抽出モデルを更新する抽出モデル更新手段と、を有し、 カテゴリそれぞれの候補を予測対象文書情報から抽出して格納した予測対象抽出候補記憶手段と、 前記予測対象抽出候補記憶手段に格納された前記カテゴリそれぞれの候補の全ての可能な組み合わせに対して、当該組み合わせの特徴を表す特徴ベクトルを計算し、前記抽出モデル記憶手段に格納された抽出モデルと前記特徴ベクトルを用いて算出されるスコアが最大となる組み合わせを取得する情報抽出手段と、を有すること を特徴とする情報抽出装置。
IPC (1件):
G06F 17/30 ( 200 6.01)
FI (2件):
G06F 17/30 210 A ,  G06F 17/30 170 A
引用特許:
審査官引用 (4件)
全件表示

前のページに戻る