特許
J-GLOBAL ID:201803012737360427

エンティティの属性をマッピングする方法及びシステム

発明者:
出願人/特許権者:
代理人 (3件): 鮫島 睦 ,  川端 純市 ,  柏原 啓伸
公報種別:公開公報
出願番号(国際出願番号):特願2018-043240
公開番号(公開出願番号):特開2018-170008
出願日: 2018年03月09日
公開日(公表日): 2018年11月01日
要約:
【課題】異種のデータソースをマッピングするシステム及び方法を提供する。【解決手段】システムは、データ分析のために、監視されるベイズモデル(SBM)と監視されないテキストの類似(UTS)モデルの組み合わせを用いる。SBMとUTSの重み付けアンサンブルが用いられ、アンサンブルは信頼基準に基づいて重み付けされる。システムは、データ処理を実行することにより、比較される異なるデータソース(ローカルデータベース及び対応するグローバルデータベース)の間でデータマッチングを特定し、見出されるデータマッチングに基づいて、ローカルデータベースとグローバルデータベースとの間でマッピングを実行する。【選択図】図2
請求項(抜粋):
異種のデータベースをマッピングするプロセッサ実装方法(200)であって、 データマッピングシステム100により、一つ若しくはそれ以上のハードウエアプロセッサを介して、インプットとして少なくとも一つのローカルデータベースを受信するステップ(202)と、 データマッピングシステム100により、一つ若しくはそれ以上のハードウエアプロセッサを介して、ローカルデータベース内の複数の製品エントリの各々に対応する、少なくとも一つの特徴(204)及び少なくとも一つの記載(206)を抽出するステップと、及び、 データマッピングシステム100により、自動マッピングを実行すること(218)により、ローカルデータベースと、対応するグローバルデータベースとの間でマッピングを実行するステップと を含み、 前記自動マッピングは、 ローカルデータベース内の複数の製品エントリの各々についての少なくとも一つの特徴、及び対応するグローバルデータベースからの製品データについて、監視されるベイズモデル(SBM)を適用すること(210)により、第1のセットの確率分布及び信頼値を生成することと、 ローカルデータベース内の複数の製品エントリの各々についての少なくとも一つの記載、及び対応するグローバルデータベースからの製品データについて、監視されないテキストの類似(UTS)モデルを適用すること(212)により、第2のセットの確率分布及び信頼値を生成することと、 第1のセットの確率分布及び信頼値、並びに、第2のセットの確率分布及び信頼値に基づいて、重み付け信頼スコア及び確率分布を生成すること(214)であって、重み付け信頼スコア及び確率分布は、ローカルデータベース内の複数の製品エントリと、対応するグローバルデータベース内の複数の製品エントリとの間の、類似の範囲を表す、生成することと、並びに、 第1のセットの確率分布及び信頼値、第2のセットの確率分布及び信頼値、及び、重み付け信頼スコア及び確率分布に基づいて、ローカルデータベース及び対応するグローバルデータベースをマッピングすることであって、ローカルデータベースからの全ての製品は、グローバルデータベース内の対応する製品データへマッピングされる、マッピングすることと を含む、プロセッサ実装方法。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 350C ,  G06F17/30 180D
引用特許:
審査官引用 (4件)
全件表示
引用文献:
審査官引用 (1件)
  • Minimally-Supervised Attribute Fusion for Data Lakes

前のページに戻る