特許
J-GLOBAL ID:201003088787805141

データ名寄せ処理装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 平木 祐輔
公報種別:公開公報
出願番号(国際出願番号):特願2009-074817
公開番号(公開出願番号):特開2010-231253
出願日: 2009年03月25日
公開日(公表日): 2010年10月14日
要約:
【課題】オブジェクトの文字列の表記揺れがある場合に、オブジェクトの同一性を正しく判定する。【解決手段】データ中から表記が類似するオブジェクトの組を抽出し、それぞれのオブジェクトをクエリとして検索を行う。これによりそれぞれのオブジェクトに関連する文書からなる文書集合を取得する。そして、文書集合から地名、住所、人名などの固有名を根拠情報として抽出し、根拠情報同士の比較を行うことによりオブジェクトの同一性を判定する。【選択図】図1
請求項(抜粋):
それぞれ名称を構成する少なくとも2つの文字列について、当該文字列の類似度を計算する文字列類似度計算処理部と、 前記文字列の類似度の計算の結果、完全一致はしていないが所定の類似度以上を有する前記少なくとも2つの文字列について文書中における使用形態に基づいて、前記少なくとも2つの文字列の同一性を判断する文字列同一性判断部と、 を備えることを特徴とするデータ名寄せ処理装置。
IPC (2件):
G06F 17/30 ,  G06F 17/21
FI (4件):
G06F17/30 350C ,  G06F17/30 240C ,  G06F17/21 550A ,  G06F17/21 550K
Fターム (4件):
5B075QP03 ,  5B109QA03 ,  5B109QA04 ,  5B109QA15

前のページに戻る