特許
J-GLOBAL ID:201503060177190042

表現抽出モデル学習装置、表現抽出モデル学習方法、および、コンピュータ・プログラム

発明者:
出願人/特許権者:
代理人 (2件): 机 昌彦 ,  下坂 直樹
公報種別:公開公報
出願番号(国際出願番号):特願2013-144532
公開番号(公開出願番号):特開2015-018372
出願日: 2013年07月10日
公開日(公表日): 2015年01月29日
要約:
【課題】表現抽出の対象が文レベルであっても、抽出モデル生成のために収集される正解データに含まれる偽の正解データの影響を低減する技術を提供すること。 【解決手段】特定種類の表現を含むか否かのラベルが付与された正解データに基づいて、第1の表現抽出モデルを学習する第1の学習部11と、第1の表現抽出モデルを用いて、追加の正解データを文書から抽出する追加正解抽出部12と、正解データおよび追加の正解データから素性の候補を抽出する素性候補抽出部13と、素性候補抽出部13によって抽出された候補から、正解データおよび追加の正解データにおける各候補の出現頻度に基づいて、学習用の素性を選択する素性選択部14と、素性選択部14で選択された素性を用いて第2の表現抽出モデルを学習する第2の学習部15と、を備える。【選択図】 図1
請求項(抜粋):
特定種類の表現を含むか否かのラベルが付与された正解データに基づいて、第1の表現抽出モデルを学習する第1の学習部と、 前記第1の表現抽出モデルを用いて、追加の正解データを文書から抽出する追加正解抽出部と、 前記正解データおよび前記追加の正解データから素性の候補を抽出する素性候補抽出部と、 前記素性候補抽出部によって抽出された候補から、前記正解データおよび前記追加の正解データにおける前記各候補の出現頻度に基づいて、学習用の素性を選択する素性選択部と、 前記素性選択部で選択された素性を用いて第2の表現抽出モデルを学習する第2の学習部と、 を備える表現抽出モデル学習装置。
IPC (1件):
G06F 17/30
FI (3件):
G06F17/30 340B ,  G06F17/30 170A ,  G06F17/30 350C

前のページに戻る