抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近似的質問処理(AQP)に関する研究の何十年にも係わらず,試料ベース接合の理解は,限られたままであり,また,ある程度,表在的である。コミュニティにおける共通信念は,ランダムサンプルを結合するのが fuしいことである。この信念は,2つの均一試料の接合が元の接合の独立サンプルではなく,二次的に少ない出力タプルをもたらすことを示す初期結果に基づいている。しかし,残念ながら,この結果は,重要な質問実務者面に対してほとんど適用できない。例えば,成功計量は,出力基数よりも,むしろ最終近似精度である。さらに,1つが採用できる多くの不均一サンプリング戦略がある。これらの設定の全てにおいて,接合のためのIsサンプリングは,まだ無駄である。そうでなければ,各事例で最良のサンプリング戦略である。知る限りでは,これらの質問に答えた形式的研究はない。本論文は,サンプルベースの接合の理解を改善し,実務家の建築と実世界のAQPシステムの使用のためのガイドラインを提供することを目的とする。著者らは,オフラインサンプリング予算を与える,近似結合クエリにおけるオフラインサンプルの限界を研究し,2つのテーブルの結合を近似できる。この疑問を2つの成功計量,すなわち出力サイズと推定変数に答えた。出力サイズの最大化は容易であり,一方,任意のサンプリング戦略によって達成可能な最低分散に情報理論的下限が存在することを示す。次に,層状,宇宙,およびBernoulliサンプリングのすべての組合せを捉えるハイブリッドサンプリング方式を定義し,著者らの最適パラメータを有するこの方式が一定の因子内で理論的下限を達成することを示した。これらの最適パラメータの計算はネットワーク全体にわたるシャッフリング統計量を必要とするので,各ノードが最小統計量を用いて自律的に動作する分散バリアントを提案した。【JST・京大機械翻訳】