Pat
J-GLOBAL ID:200903034745475377
組織名抽出装置、方法及びプログラム
Inventor:
,
,
Applicant, Patent owner:
Agent (2):
志賀 正武
, 村山 靖彦
Gazette classification:公開公報
Application number (International application number):2007255263
Publication number (International publication number):2009086979
Application date: Sep. 28, 2007
Publication date: Apr. 23, 2009
Summary:
【課題】同義語、対訳語、略語、表記揺れの語などの表現の揺らぎの種類によらずに同一のものを示す異なる表現の組織名を抽出することができる組織名抽出装置を提供する。【解決手段】Webデータ11から、ドメイン名に対応付けられている文字列である組織名候補と、当該ドメイン名を示す文字列とを抽出する組織名候補抽出部14と、組織名候補の一部又は全部をアルファベット又は英単語に変換した英数字からなる文字列を生成するアルファベット変換部16と、生成した文字列と、当該組織名候補に対応するドメイン名を示す文字列とを比較し、所定の条件に基づいて一致すると判定された場合に、当該組織名候補を、組織名を示す語句として抽出する一致度判定処理部18とを備える組織名抽出装置。【選択図】図1
Claim (excerpt):
ウェブデータから、ドメイン名に対応付けられている文字列である組織名候補と、当該ドメイン名を示す文字列とを抽出する組織候補名抽出手段と、
抽出した組織名候補の一部又は全部をアルファベット又は英単語に変換した英数字からなる文字列を生成する変換手段と、
変換手段によって生成した文字列と、当該組織名候補に対応するドメイン名を示す文字列とを比較し、所定の条件に基づいて一致すると判定された場合に、当該組織名候補を、組織名を示す語句として抽出する一致度判定処理手段と
を備えることを特徴とする組織名抽出装置。
IPC (2):
FI (3):
G06F17/30 220Z
, G06F17/30 170A
, G06F17/27 E
F-Term (8):
5B075NK31
, 5B091AA15
, 5B091AB06
, 5B091AB17
, 5B091BA02
, 5B091CA02
, 5B091CC02
, 5B091CC16
Patent cited by the Patent: