抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
データ科学の第一ステップを容易にするための大規模データテーブルの小型で有益なサブテーブルを作成するためのフレームワークを提案した。大きなデータテーブルテーブルTを与えられた場合,目標は,Tの列の部分集合を選択し,それらをTの列の部分集合に投影することによって,小さな固定次元のサブテーブルを作成することである。質問は,どの列と柱を,有益なサブテーブルを得るために選択すべきかである。著者らは,2つの相補的メトリックスに基づく「情報性」の概念を形式化して,それは,サブテーブルがTと多様性において顕著な相関ルールをいかによく捉えるかを測定するセルカバレッジである。これらのメトリックスを用いた最適サブテーブルの計算は実行不可能なので,テーブル埋込みを用いて相関ルールを間接的に説明する効率的なアルゴリズムを与えた。得られたフレームワークは,完全なサブテーブルを可視化し,また,サブテーブル上のクエリの結果を表示するのに使用可能であり,ユーザが結果を迅速に理解し,その後のクエリを決定するのを可能にする。実験結果は,ユーザスタディからのフィードバックだけでなく,著者らのメトリックによって測定される高品質サブテーブルを効率的に計算できることを示した。【JST・京大機械翻訳】