Pat
J-GLOBAL ID:200903000839652300

用語集生成装置及び用語集生成プログラム並びに用語集検索装置

Inventor:
Applicant, Patent owner:
Agent (1): 磯野 道造
Gazette classification:公開公報
Application number (International application number):2001289477
Publication number (International publication number):2003099429
Application date: Sep. 21, 2001
Publication date: Apr. 04, 2003
Summary:
【要約】【課題】 自然言語のテキストデータから、連体修飾節に基づいて、用語及びその用語を定義する解説データを抽出する用語集生成装置及び用語集生成プログラム、並びに用語からその用語の解説データを検索する用語集検索装置を提供する。【解決手段】 用語集生成装置1は、テキストデータの文節の係り受け情報を生成する係り受け解析手段11と、用語データを抽出する用語データ抽出手段12と、用語データの上位概念を示す概念データを抽出する概念データ抽出手段13と、連体修飾節が用語を定義する説明文となるときの特徴となる学習データを登録した学習データベース16と、用語データを定義する連体修飾節を修飾データとして抽出する修飾データ抽出手段15と、解説データを生成する解説データ生成手段17と、を含む構成とした。
Claim (excerpt):
入力された自然言語のテキストデータから、用語データを定義する解説データを生成する用語集生成装置であって、前記テキストデータを形態素解析及び構文解析を行なうことで、前記テキストデータの文節の係り受け情報を生成する係り受け解析手段と、前記テキストデータから、名詞または名詞句となる文字列を解析し、用語データとして抽出する用語データ抽出手段と、前記係り受け情報と、用語データを言い換える特定の言い換え表現とに基づいて、前記テキストデータから、前記用語データの上位概念を示す概念データを抽出する概念データ抽出手段と、予め連体修飾節が用語を定義する説明文となるときの特徴となる学習データを登録した学習データベースと、前記係り受け情報と前記学習データとに基づいて、前記用語データに係る連体修飾節が前記用語データの定義となっているかを判断し、定義と判断された連体修飾節を修飾データとして抽出する修飾データ抽出手段と、前記概念データと前記修飾データとに基づいて、前記用語データを定義する解説データを生成する解説データ生成手段と、を備えて構成されていることを特徴とする用語集生成装置。
IPC (5):
G06F 17/28 ,  G06F 17/21 550 ,  G06F 17/30 170 ,  G06F 17/30 ,  G06F 17/30 230
FI (5):
G06F 17/28 U ,  G06F 17/21 550 A ,  G06F 17/30 170 A ,  G06F 17/30 170 J ,  G06F 17/30 230 Z
F-Term (14):
5B009MB03 ,  5B009ME25 ,  5B009MF02 ,  5B075ND03 ,  5B075ND22 ,  5B075NK02 ,  5B075NR02 ,  5B075NR20 ,  5B075UU01 ,  5B091AA15 ,  5B091CA05 ,  5B091CC02 ,  5B091CC04 ,  5B091CC16

Return to Previous Page