特許
J-GLOBAL ID:200903000839652300

用語集生成装置及び用語集生成プログラム並びに用語集検索装置

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2001-289477
公開番号(公開出願番号):特開2003-099429
出願日: 2001年09月21日
公開日(公表日): 2003年04月04日
要約:
【要約】【課題】 自然言語のテキストデータから、連体修飾節に基づいて、用語及びその用語を定義する解説データを抽出する用語集生成装置及び用語集生成プログラム、並びに用語からその用語の解説データを検索する用語集検索装置を提供する。【解決手段】 用語集生成装置1は、テキストデータの文節の係り受け情報を生成する係り受け解析手段11と、用語データを抽出する用語データ抽出手段12と、用語データの上位概念を示す概念データを抽出する概念データ抽出手段13と、連体修飾節が用語を定義する説明文となるときの特徴となる学習データを登録した学習データベース16と、用語データを定義する連体修飾節を修飾データとして抽出する修飾データ抽出手段15と、解説データを生成する解説データ生成手段17と、を含む構成とした。
請求項(抜粋):
入力された自然言語のテキストデータから、用語データを定義する解説データを生成する用語集生成装置であって、前記テキストデータを形態素解析及び構文解析を行なうことで、前記テキストデータの文節の係り受け情報を生成する係り受け解析手段と、前記テキストデータから、名詞または名詞句となる文字列を解析し、用語データとして抽出する用語データ抽出手段と、前記係り受け情報と、用語データを言い換える特定の言い換え表現とに基づいて、前記テキストデータから、前記用語データの上位概念を示す概念データを抽出する概念データ抽出手段と、予め連体修飾節が用語を定義する説明文となるときの特徴となる学習データを登録した学習データベースと、前記係り受け情報と前記学習データとに基づいて、前記用語データに係る連体修飾節が前記用語データの定義となっているかを判断し、定義と判断された連体修飾節を修飾データとして抽出する修飾データ抽出手段と、前記概念データと前記修飾データとに基づいて、前記用語データを定義する解説データを生成する解説データ生成手段と、を備えて構成されていることを特徴とする用語集生成装置。
IPC (5件):
G06F 17/28 ,  G06F 17/21 550 ,  G06F 17/30 170 ,  G06F 17/30 ,  G06F 17/30 230
FI (5件):
G06F 17/28 U ,  G06F 17/21 550 A ,  G06F 17/30 170 A ,  G06F 17/30 170 J ,  G06F 17/30 230 Z
Fターム (14件):
5B009MB03 ,  5B009ME25 ,  5B009MF02 ,  5B075ND03 ,  5B075ND22 ,  5B075NK02 ,  5B075NR02 ,  5B075NR20 ,  5B075UU01 ,  5B091AA15 ,  5B091CA05 ,  5B091CC02 ,  5B091CC04 ,  5B091CC16

前のページに戻る