特許
J-GLOBAL ID:201603012480663631
照合処理システム、方法、及びプログラム
発明者:
出願人/特許権者:
代理人 (3件):
伊東 忠重
, 伊東 忠彦
, 加藤 隆夫
公報種別:公開公報
出願番号(国際出願番号):特願2016-034429
公開番号(公開出願番号):特開2016-192202
出願日: 2016年02月25日
公開日(公表日): 2016年11月10日
要約:
【課題】複数のデータソースに渡る異種命名規則を照合し、その結果を結合する。【解決手段】異なる名前値を照合する照合処理システムは、複数のキー値の各々について名前値を識別するデータソース分類器であり、構造化データソースの各々を2つのカテゴリのうちの1つに割り当てるよう構成される。まず類似基準を満たす名前値を見付け、名前値及びインデックス構造化データソースからの名前値を互いの別名として第1の結果リストに格納し、同じ構造化データソースの中のラベル付きデータ値から異なる名前値が識別された場合、それらを互いの別名として第2の結果リストに格納する。そして、第1の結果リストからの名前値の別名と第2の結果リストからの同一の名前値の別名を互いの別名として結合結果リストに格納することにより、結合結果リストを生成する。【選択図】図1
請求項(抜粋):
複数のデータソースに渡り同じエンティティを表すために用いられる異なる名前値を照合する照合処理システムであって、前記複数のデータソースはラベル付きデータ値により構成される構造化データソースを有し、各々のラベル付きデータ値は複数のエンティティのうちの1つの特性を表し、前記エンティティはキー値により識別され、前記特性は前記データ値のラベルにより識別可能であり、前記システムは、
前記複数のキー値の各々について、1又は複数の名前値を識別するよう構成されるデータソース分類器であって、名前値はラベル付きデータ値であり、前記ラベルは、前記特性が前記キー値により識別されたエンティティに名前を帰属させることを示し、前記データソース分類器は、構造化データソースの各々を2つのカテゴリのうちの1つに割り当てるよう構成され、前記2つのカテゴリは、
前記構造化データソースの中の各々のキー値について1つの名前値のみが存在する、第1のカテゴリと、
前記構造化データソースが、それぞれ1より多くの異なる名前値を有する1又は複数のキー値を有する、第2のカテゴリと、を有する、データソース分類器と、
第1の照合プロセッサであって、前記第1のカテゴリの中に1より多くの構造化データソースが存在する場合に、前記第1のカテゴリの中の前記構造化データソースのうちの1つをインデックス構造化データソースとして用い、前記インデックス構造化データソースの中の各々の名前値について、前記第1のカテゴリの残りの構造化データソースから、前記インデックス構造化データソースからの名前値と比較されるとき第1の類似基準を満たす名前値を見付け、前記の見付けた名前値及び前記インデックス構造化データソースからの名前値を互いの別名として第1の結果リストに格納するよう構成される、第1の照合プロセッサと、
第2の照合プロセッサであって、前記第2のカテゴリの中の各々の構造化データソースについて、前記構造化データソースの中の各々のキー値について、前記キー値により識別されたエンティティに名前を帰属させる名前値である、同じ構造化データソースの中のラベル付きデータ値を識別し、1より多い異なる名前値が識別された場合、該1より多い異なる名前値を互いの別名として第2の結果リストに格納するよう構成される、第2の照合プロセッサと、
結果リスト結合器であって、前記第2の結果リストを前記第1の結果リストに付加し、前記第1の結果リストの中に現れる名前値の各々について、同一の名前値が前記第2の結果リストの中に現れる場合に、前記第1の結果リストからの名前値の別名と前記第2の結果リストからの前記同一の名前値の別名を互いの別名として結合結果リストに格納することにより、前記結合結果リストを生成するよう構成される、結果リスト結合器と、
を有する照合処理システム。
IPC (2件):
FI (4件):
G06F17/30 320D
, G06F17/30 350C
, G06F12/00 520E
, G06F17/30 210D
前のページに戻る