特許
J-GLOBAL ID:200903045701733796

固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置

発明者:
出願人/特許権者:
代理人 (1件): 酒井 宏明
公報種別:公開公報
出願番号(国際出願番号):特願2007-035434
公開番号(公開出願番号):特開2008-198132
出願日: 2007年02月15日
公開日(公表日): 2008年08月28日
要約:
【課題】多大な労力を要することなく、テキストデータから固有表現を抽出する手がかりを得るための辞書情報を簡易に作成することを課題とする。【解決手段】固有表現抽出装置は、各NE抽出器から取得した複数のNE抽出結果から単語(例えば、「山田」や「さん」など)をそれぞれ抽出する。そして、抽出した各単語について順番に処理をそれぞれ実行する。固有表現抽出装置は、抽出した各単語の中のどれか一つについて各NE抽出結果をそれぞれ順番にチェックしてNE候補分類を抽出する。NE候補分類を抽出した後、抽出したNE候補分類の各NE抽出結果における出現頻度を計数する。出現頻度を計数した後、出現頻度に応じたNE候補分類の順位を決定する。【選択図】 図2
請求項(抜粋):
テキストデータから固有表現を抽出するためのモデルを用いた固有表現抽出処理をコンピュータに実行させる固有表現抽出プログラムであって、 前記固有表現抽出処理の結果得られる固有表現抽出結果を取得する抽出結果取得手順と、 テキストデータから固有表現を抽出する際に手がかりとして利用される辞書情報を、前記抽出結果取得手順により取得された固有表現抽出結果に基づいて作成する辞書情報作成手順と、 をコンピュータに実行させることを特徴とする固有表現抽出プログラム。
IPC (1件):
G06F 17/28
FI (1件):
G06F17/28 U
Fターム (4件):
5B091AA15 ,  5B091AB06 ,  5B091CA02 ,  5B091CC16
引用特許:
出願人引用 (3件) 審査官引用 (2件)

前のページに戻る