Pat
J-GLOBAL ID:202103002313491840

専門用語抽出装置、専門用語抽出方法及びプログラム

Inventor:
Applicant, Patent owner:
Agent (3): 木村 満 ,  武山 敦史 ,  森川 泰司
Gazette classification:公開公報
Application number (International application number):2020186260
Publication number (International publication number):2021192212
Application date: Nov. 09, 2020
Publication date: Dec. 16, 2021
Summary:
【課題】テキストデータから専門用語を抽出する精度を向上させた専門用語抽出装置、専門用語抽出方法及びプログラムを提供する。【解決手段】専門用語抽出装置100は、文書のテキストデータを取得するテキストデータ取得部151と、テキストデータ取得部151により取得されたテキストデータからNグラムのチャンクを抽出するNグラム抽出部153と、Nグラム抽出部153で生成されたNグラムのチャンクから体言を認識することで専門用語の候補語を抽出し、抽出された候補語のテキストデータにおける出現頻度をカウントする候補語判別部154と、候補語判別部154でカウントされた候補語の出現頻度と当該候補語が抽出されたNグラムの長さとに基づいて、当該候補語が専門用語に該当するかどうかを判別する専門用語判別部155と、専門用語判別部155で専門用語として判別された候補語を記憶部140に登録する専門用語登録部156と、を備える。【選択図】図1
Claim (excerpt):
文書のテキストデータを取得するテキストデータ取得部と、 前記テキストデータ取得部により取得されたテキストデータからNグラムのチャンクを抽出するNグラム抽出部と、 前記Nグラム抽出部で生成されたNグラムのチャンクから体言を認識することで専門用語の候補語を抽出し、抽出された候補語の前記テキストデータにおける出現頻度をカウントする候補語判別部と、 前記候補語判別部でカウントされた候補語の出現頻度と当該候補語が抽出されたNグラムの長さとに基づいて、当該候補語が専門用語に該当するかどうかを判別する専門用語判別部と、 前記専門用語判別部で専門用語として判別された候補語を記憶部に登録する専門用語登録部と、 を備える専門用語抽出装置。
IPC (1):
G06F 40/279
FI (1):
G06F40/279
F-Term (1):
5B091AB08

Return to Previous Page