特許
J-GLOBAL ID:200903049188899484
固有表現抽出装置および方法
発明者:
,
,
出願人/特許権者:
代理人 (8件):
鈴江 武彦
, 河野 哲
, 中村 誠
, 蔵田 昌俊
, 峰 隆司
, 福原 淑弘
, 村松 貞男
, 橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2005-342338
公開番号(公開出願番号):特開2007-148785
出願日: 2005年11月28日
公開日(公表日): 2007年06月14日
要約:
【課題】文脈にそった固有表現を重要と判定することができると同時に固有表現の重み判定の一貫性を維持する。【解決手段】少なくとも1文書を含むテキストを取得する手段101と、テキストから複数の固有表現を抽出する手段102と、各固有表現に対して、固有表現の分類名を示す固有表現クラスを算出する手段103と、各固有表現クラスがテキスト中に出現する度合いを示す出現頻度情報に基づいて、固有表現クラスのクラス重みを算出する手段103と、各クラス重みに基づいて各固有表現の固有表現重みを算出する手段104と、複数の固有表現重みに基づいて、出力する固有表現と出力しない固有表現とに分離する手段105と、出力する固有表現を出力する手段106と、を具備する。【選択図】図1
請求項(抜粋):
少なくとも1文書を含むテキストを取得する手段と、
前記テキストから複数の固有表現を抽出する手段と、
各前記固有表現に対して、固有表現の分類名を示す固有表現クラスを算出する手段と、
各前記固有表現クラスが前記テキスト中に出現する度合いを示す出現頻度情報に基づいて、前記固有表現クラスのクラス重みを算出するクラス重み算出手段と、
各前記クラス重みに基づいて、各前記固有表現の固有表現重みを算出する固有表現重み算出手段と、
複数の前記固有表現重みに基づいて、出力する固有表現と出力しない固有表現とに分離する分離手段と、
前記出力する固有表現を出力する手段と、を具備することを特徴とする固有表現抽出装置。
IPC (1件):
FI (1件):
Fターム (2件):
引用特許:
前のページに戻る