特許
J-GLOBAL ID:200903037492231793
固有名詞抽出装置、固有名詞抽出方法及び記憶媒体
発明者:
出願人/特許権者:
代理人 (1件):
柏木 慎史 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-376742
公開番号(公開出願番号):特開2002-183133
出願日: 2000年12月12日
公開日(公表日): 2002年06月28日
要約:
【要約】【課題】 固有名詞の抽出精度を向上させる。【解決手段】 日本語文書を入力する文書入力手段と(S1)、この文書入力手段により入力された前記日本語文書について、表記と品詞とを関連付けて記憶した日本語形態素辞書と品詞間の接続規則を定めた形態素解析規則とを参照して形態素単位に分割する形態素解析を実行する形態素解析手段と(S2)、この形態素解析手段による解析結果に基づき前記日本語形態素辞書に未登録の名詞及び複合名詞を認識する未登録名詞認識手段と(S2)、この未登録名詞認識手段により認識された未登録の複合名詞から固有名詞を認識し、その構造を解析する固有名詞認識手段と(S3)、を備える。これにより、日本語文書から抽出・認識された固有名詞がその内部にも固有名詞を含む場合、その内部構造の固有名詞も抽出することができるので、固有名詞の抽出精度を向上させることができる。
請求項(抜粋):
日本語文書を入力する文書入力手段と、表記と品詞とを関連付けて記憶した日本語形態素辞書と、品詞間の接続規則を定めた形態素解析規則と、この文書入力手段により入力された前記日本語文書について、前記日本語形態素辞書と前記形態素解析規則とを参照して形態素単位に分割する形態素解析を実行する形態素解析手段と、この形態素解析手段による解析結果に基づき前記日本語形態素辞書に未登録の名詞及び複合名詞を認識する未登録名詞認識手段と、この未登録名詞認識手段により認識された未登録の複合名詞から固有名詞を認識し、その構造を解析する固有名詞認識手段と、を備える固有名詞抽出装置。
IPC (4件):
G06F 17/27
, G06F 17/30 170
, G06F 17/30 210
, G06F 17/30
FI (4件):
G06F 17/27 E
, G06F 17/30 170 A
, G06F 17/30 210 A
, G06F 17/30 210 D
Fターム (5件):
5B075ND03
, 5B075NK32
, 5B075PR01
, 5B075QS01
, 5B091CA02
前のページに戻る