特許
J-GLOBAL ID:200903022022599959

固有表現判別装置、固有表現判別方法、および固有表現判別プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 丸山 隆夫
公報種別:公開公報
出願番号(国際出願番号):特願2000-278691
公開番号(公開出願番号):特開2002-082943
出願日: 2000年09月08日
公開日(公表日): 2002年03月22日
要約:
【要約】【課題】 WWWのようなハイパーテキストデータベースを構成する各ノードページのテキスト中に出現する固有表現(地名・人名・組織名など)を高精度に判別可能な固有表現判別装置を提供する。【解決手段】 読み込み手段2は、ハイパーテキストデータベース1からテキストを読み込む。単一テキスト解析手段4は、読み込み手段2によって読み込まれた各テキストから、そのテキスト内の解析処理によって、そのテキスト内に出現する固有表現候補を検出する。複合テキスト解析手段6は、単一テキスト解析手段4によって検出された固有表現候補の確からしさを、その固有表現候補の出現したテキストに対するリンク元あるいはリンク先のテキストを参照した解析処理によって計算する。
請求項(抜粋):
テキスト中に出現する地名、人名、組織名などの固有表現を検出する固有表現判別装置において、ハイパーテキストデータベースからテキストを読み込む読み込み手段と、前記読み込み手段によって読み込まれた各テキストから、該テキスト内の解析処理によって、該テキスト内に出現する固有表現候補を検出する単一テキスト解析手段と、前記単一テキスト解析手段によって検出された固有表現候補の確からしさを、該固有表現候補の出現したテキストに対するリンク元、リンク先の両方若しくは一方のテキストを参照した解析処理により計算する複合テキスト解析処理と、を備えたことを特徴とする固有表現判別装置。
IPC (2件):
G06F 17/22 522 ,  G06F 17/21 550
FI (2件):
G06F 17/22 522 L ,  G06F 17/21 550 Z
Fターム (2件):
5B009MB07 ,  5B009MB21
引用特許:
審査官引用 (2件)
  • 特開平3-263260
  • 文書処理システム
    公報種別:公開公報   出願番号:特願平8-141644   出願人:沖電気工業株式会社

前のページに戻る