抄録/ポイント: 抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,ビッグデータの一つであるパーソナルデータの分析が注目されるようになってきた。パーソナルデータの分析では,不意・故意に関わらずデータ内の個人のプライバシが侵害されることがある。これを防ぐ方法として,個人の情報ではない集約情報である統計値を分析者へ公開することが考えられる。しかしながら,統計値の公開は分析者にとって有効ではない。なぜならば,公開された統計値の組み合わせから様々な分析結果を得ることは容易でないからである。本研究では,プライバシ保護のため統計値から,分析に必要な生のデータの複数の性質を保持するミクロデータ形式のデータ(擬似データ)を生成する手法を提案する。ミクロデータ形式のデータであれば,分析者は統計解析ソフトウェアによって様々な分析を容易に行うことができる。我々の提案する擬似データは,生のデータにおける各属性のヒストグラムと等しくなるランダムなミクロデータを生成し,それを線形変換することによって,各属性の平均,分散共分散を正確に保持,各属性のヒストグラムと各二属性間のクロス集計表の近似を保持する。このため,ビッグデータ分析でよく用いられる線形回帰モデルを誤差なく計算できる。また,本手法は数値属性だけでなくカテゴリ属性を含むデータに対しても適用可能である。ヒストグラムとクロス集計表の近似度合いは,実データセットを用いて実験的に評価した。(著者抄録)