特許
J-GLOBAL ID:201903013212795558

分散型機械学習システム、装置、および方法

発明者:
出願人/特許権者:
代理人 (1件): 特許業務法人平木国際特許事務所
公報種別:公表公報
出願番号(国際出願番号):特願2019-502045
公開番号(公開出願番号):特表2019-526851
出願日: 2017年07月17日
公開日(公表日): 2019年09月19日
要約:
分散型オンライン機械学習システムを提供する。想定されるシステムは、それぞれがローカルプライベートデータを有する多くのプライベートデータサーバを含む。研究者は、プライベートデータの匿名化を要求することなくまたはプライベートデータを無許可のコンピューティングシステムに晒すことなく、関連するプライベートデータサーバが、機械学習アルゴリズムの実装をそれらのローカルプライベートデータでトレーニングすることを要求できる。また、プライベートデータサーバは、実際のデータのデータ分布に従って合成データまたはプロキシデータを生成する。サーバは、プロキシデータを使用してプロキシモデルをトレーニングする。プロキシモデルがトレーニング済み実モデルと十分に類似している場合、プロキシデータ、プロキシモデルパラメータ、または他の学習された知識を1つまたは複数の非プライベート演算デバイスに送信できる。多くのプライベートデータサーバから学習された知識は、プライベートデータを公開することなく、1つ以上のトレーニング済みグローバルモデルに集約できる。【選択図】図1
請求項(抜粋):
分散型機械学習システムであって、 それぞれがローカルプライベートデータへのアクセスを有しおよび少なくとも1つのモデリングエンジンを有する複数のプライベートデータサーバを備え、前記複数のプライベートデータサーバは、ネットワークを介して、少なくとも1つの非プライベート演算デバイスに通信可能に接続されており、 各前記プライベートデータサーバは、非一時的コンピュータ可読メモリに格納された少なくとも1つのプロセッサソフトウェア命令による実行に応じて、その少なくとも1つのモデリングエンジンに、 前記ローカルプライベートデータの少なくとも一部から、機械学習アルゴリズムの実装に従って、トレーニング済み実モデルを作成するためのモデル指示を受信するステップ、 前記機械学習アルゴリズムの実装を前記ローカルプライベートデータでトレーニングすることによって、前記モデル指示に従っておよび前記ローカルプライベートデータの少なくとも一部の関数として、トレーニング済み実モデルパラメータを含む前記トレーニング済み実モデルを作成するステップ、 前記ローカルプライベートデータから、前記トレーニング済み実モデルを作成するために使用される前記ローカルプライベートデータを集約的に表す複数のプライベートデータ分布を生成するステップ、 前記複数のプライベートデータ分布に従ってプロキシデータのセットを生成するステップ、 前記機械学習モデルのタイプを前記プロキシデータのセットでトレーニングすることによって、前記プロキシデータのセットから、プロキシモデルパラメータを含むトレーニング済みプロキシモデルを作成するステップ、 前記プロキシモデルパラメータおよび前記トレーニング済み実モデルパラメータの関数としてモデル類似性スコアを算出するステップ、 前記ネットワークを介して、前記モデル類似性スコアの関数として、前記プロキシデータのセットを少なくとも1つの非プライベート演算デバイスに送信するステップ、 を実行させるシステム。
IPC (2件):
G06N 20/00 ,  G16H 10/00
FI (2件):
G06N20/00 ,  G16H10/00
Fターム (1件):
5L099AA21

前のページに戻る