特許
J-GLOBAL ID:200903034745475377
組織名抽出装置、方法及びプログラム
発明者:
,
,
出願人/特許権者:
代理人 (2件):
志賀 正武
, 村山 靖彦
公報種別:公開公報
出願番号(国際出願番号):特願2007-255263
公開番号(公開出願番号):特開2009-086979
出願日: 2007年09月28日
公開日(公表日): 2009年04月23日
要約:
【課題】同義語、対訳語、略語、表記揺れの語などの表現の揺らぎの種類によらずに同一のものを示す異なる表現の組織名を抽出することができる組織名抽出装置を提供する。【解決手段】Webデータ11から、ドメイン名に対応付けられている文字列である組織名候補と、当該ドメイン名を示す文字列とを抽出する組織名候補抽出部14と、組織名候補の一部又は全部をアルファベット又は英単語に変換した英数字からなる文字列を生成するアルファベット変換部16と、生成した文字列と、当該組織名候補に対応するドメイン名を示す文字列とを比較し、所定の条件に基づいて一致すると判定された場合に、当該組織名候補を、組織名を示す語句として抽出する一致度判定処理部18とを備える組織名抽出装置。【選択図】図1
請求項(抜粋):
ウェブデータから、ドメイン名に対応付けられている文字列である組織名候補と、当該ドメイン名を示す文字列とを抽出する組織候補名抽出手段と、
抽出した組織名候補の一部又は全部をアルファベット又は英単語に変換した英数字からなる文字列を生成する変換手段と、
変換手段によって生成した文字列と、当該組織名候補に対応するドメイン名を示す文字列とを比較し、所定の条件に基づいて一致すると判定された場合に、当該組織名候補を、組織名を示す語句として抽出する一致度判定処理手段と
を備えることを特徴とする組織名抽出装置。
IPC (2件):
FI (3件):
G06F17/30 220Z
, G06F17/30 170A
, G06F17/27 E
Fターム (8件):
5B075NK31
, 5B091AA15
, 5B091AB06
, 5B091AB17
, 5B091BA02
, 5B091CA02
, 5B091CC02
, 5B091CC16
引用特許: