特許
J-GLOBAL ID:200903033337049185

固有表現抽出装置及び方法並びに固有表現抽出プログラム

発明者:
出願人/特許権者:
代理人 (1件): 吉田 精孝
公報種別:公開公報
出願番号(国際出願番号):特願2002-317435
公開番号(公開出願番号):特開2004-046775
出願日: 2002年10月31日
公開日(公表日): 2004年02月12日
要約:
【課題】入力文から固有表現を適切に抽出することができる固有表現抽出装置及び方法並びにプログラムを提供する。【解決手段】形態素解析モデル14を用いて入力文を形態素解析し、入力文全体の形態素列について出現確率が高い上位N個(Nは1より大きい自然数)の形態素列を抽出する形態素解析部10と、固有表現抽出モデル24を用いて前記形態素解析部10で抽出されたN個の形態素列から固有表現を含む形態素列について出現確率が高い上位M個(Mは1以上の自然数)の固有表現を含む形態素列を抽出する固有表現抽出部20とを備えた。【選択図】 図1
請求項(抜粋):
入力文から固有表現を抽出する装置において、 1以上の単語からなる単語列とその出現確率の組を含む形態素解析モデル、並びに、固有表現を含む単語列とその出現確率の組,非終端単語列とその出現確率の組及び終端単語列とその出現確率の組を含む固有表現抽出モデルを予め記憶した記憶手段と、 前記記憶手段に記憶されている形態素解析モデルを用いて入力文を形態素解析し、入力文全体の形態素列について出現確率が高い上位N個(Nは1より大きい自然数)の形態素列を抽出する第1の抽出手段と、 前記記憶手段に記憶されている固有表現抽出モデルを用いて前記第1の抽出手段で抽出されたN個の形態素列から固有表現を含む形態素列について出現確率が高い上位M個(Mは1以上の自然数)の固有表現を含む形態素列を抽出する第2の抽出手段とを備えた ことを特徴とする固有表現抽出装置。
IPC (2件):
G06F17/27 ,  G06F17/30
FI (2件):
G06F17/27 E ,  G06F17/30 170A
Fターム (3件):
5B075ND03 ,  5B075NK46 ,  5B091CA02
引用特許:
出願人引用 (3件) 審査官引用 (3件)

前のページに戻る