抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大規模データの計算空間効率的要約,即ち,大データのスケッチは,ストリーミングアルゴリズムにおける中心問題である。そのようなスケッチを用いて,いくつかのデータ分析タスクにおける事後クエリを回答した。スケッチを計算するためのアルゴリズムは,通常,高速,正確,および空間効率を必要とする。ストリーミングアルゴリズムフレームワークにおける基本的問題は,データストリームの周波数モーメントを計算することである。タイプiのf_i要素を含むシーケンスの周波数モーメントは,i≡[n]のF_k=Σ_i=1 ̄nf_i ̄kである。これは周波数ベクトル(f_1,f_2,.f_n)のl_kノルムとも呼ばれる。もう一つの重要な問題は,対応する周波数ベクトルの内積を計算することによって,2つのデータストリームの間の類似性を計算することである。Alon,MatiasおよびSzegedy ̄cite{AMS},a.k.a.戦争(またはAMS)スケッチは,周波数モーメントを計算するためのランダム化サブ線形空間(および線形時間)アルゴリズム,およびデータストリームに対応する2つの周波数ベクトルの間の内積を与える。しかし,これらの推定値の分散は典型的に大きい傾向がある。本研究では,これらの推定の分散を最小化することに焦点を当てた。著者らは,モンテカルロシミュレーションにおける分散低減のために主に知られている古典的制御-Variate法(Lavenberg)から技術を使用し,その結果,わずかな計算オーバヘッドのコストで,大きな分散低減を得ることができた。本提案の理論解析を提示し,合成および実世界データセットに関する支援実験により補完した。【JST・京大機械翻訳】