特許
J-GLOBAL ID:202403009963457189

専門用語抽出装置、専門用語抽出方法及びプログラム

発明者:
出願人/特許権者:
代理人 (4件): 木村 満 ,  森川 泰司 ,  武山 敦史 ,  和田 朋子
公報種別:特許公報
出願番号(国際出願番号):特願2020-186260
公開番号(公開出願番号):特開2021-192212
特許番号:特許第7557770号
出願日: 2020年11月09日
公開日(公表日): 2021年12月16日
請求項(抜粋):
【請求項1】 文書のテキストデータを取得するテキストデータ取得部と、 前記テキストデータ取得部により取得されたテキストデータからNグラムの文節を抽出するNグラム抽出部と、 前記Nグラム抽出部で生成されたNグラムの文節内で助詞の前にある部分全体を専門用語の候補語として抽出し、抽出された候補語の前記テキストデータにおける出現頻度をカウントする候補語判別部と、 前記候補語判別部でカウントされた候補語の出現頻度と当該候補語が抽出されたNグラムの長さとに基づいて当該候補語の重みを算出し、算出された重みが閾値以上である候補語を専門用語として判別する専門用語判別部と、 前記専門用語判別部で専門用語として判別された候補語を記憶部に登録する専門用語登録部と、 を備え、前記専門用語判別部により算出される候補語の重みは、当該候補語の出現頻度が多くなるか当該候補語が抽出されたNグラムの長さが長いほど大きくなる、 専門用語抽出装置。
IPC (2件):
G06F 40/279 ( 202 0.01) ,  G06F 40/216 ( 202 0.01)
FI (2件):
G06F 40/279 ,  G06F 40/216
引用文献:
審査官引用 (2件)
  • Web文書集合からの専門用語獲得
  • 土木関連用語辞典の見出し語の分析と検索システムにおける活用に関する考察

前のページに戻る