特許
J-GLOBAL ID:202103003104257038

固有表現抽出用ドキュメント専用地名辞典

発明者:
出願人/特許権者:
代理人 (2件): 中島 淳 ,  加藤 和詳
公報種別:特許公報
出願番号(国際出願番号):特願2016-158512
公開番号(公開出願番号):特開2017-045453
特許番号:特許第6829559号
出願日: 2016年08月12日
公開日(公表日): 2017年03月02日
請求項(抜粋):
【請求項1】 表現抽出方法であって、 ドキュメントレベルの実体タグでタグ付けされる訓練サンプルから抽出される特徴で訓練された固有表現抽出モデルを提供するステップであって、各訓練サンプルには、少なくとも1つのテキスト列が含まれる、ステップと、 ラベル付けされるテキストドキュメントを受け取るステップであって、前記テキストドキュメントが、少なくとも1つのドキュメントレベルの実体タグでタグ付けされる、ステップと、 前記少なくとも1つのドキュメントレベルの実体タグに基づいて、ドキュメント専用の地名辞典を生成するステップであって、前記ドキュメント専用の地名辞典には、一連の項目、すなわち、一連の実体名のそれぞれに対して1項目が含まれる、ステップと、 前記テキストドキュメントのテキスト列に関して、前記テキスト列のトークンに関する特徴を抽出するステップであって、前記特徴が、前記地名辞典の項目のうちの1つの前記実体名の少なくとも一部と一致するトークンに関するドキュメント専用の特徴を含む、ステップと、 前記固有表現抽出モデルを用いて、前記抽出された特徴に基づいて、前記テキストドキュメントのテキスト列内のトークンに関する実体ラベルを予測するステップと、を含み、 前記生成するステップ、前記抽出するステップ、および予測するステップの少なくとも1つは、プロセッサにより行われる、表現抽出方法。
IPC (2件):
G06F 16/45 ( 201 9.01) ,  G06F 40/295 ( 202 0.01)
FI (2件):
G06F 16/45 ,  G06F 40/295
引用特許:
出願人引用 (2件) 審査官引用 (2件)
引用文献:
出願人引用 (1件)
  • Memory-Based Named Entity Recognition using Unanno
審査官引用 (1件)
  • Memory-Based Named Entity Recognition using Unanno

前のページに戻る