文献
J-GLOBAL ID:201702233314948955   整理番号:17A1391994

ビッグ次世代シークエンシングデータセットの圧縮を高速化するためのハイブリッドMPI-OpenMP戦略【Powered by NICT】

A Hybrid MPI-OpenMP Strategy to Speedup the Compression of Big Next-Generation Sequencing Datasets
著者 (2件):
資料名:
巻: 28  号: 10  ページ: 2760-2769  発行年: 2017年 
JST資料番号: T0882A  ISSN: 1045-9219  CODEN: ITDSEO  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
DNA配列決定は,ハイスループット,低コスト次世代シークエンシング(NGS)技術の急速な発展によりビッグデータの領域に移行した。効率的にこの情報を蓄積し,分布するのに十分であることを逐次データ圧縮溶液は,落下の背後にある。本論文では,phyNGSC,分散共有メモリアーキテクチャの特徴を組み合わせることにより大きなNGSデータの圧縮を高速化するハイブリッドMPI-OpenMP戦略を導入した。著者らのアルゴリズムは,プロセスとスレッド間の作業負荷を均衡させ,局所性を利用することによりメモリ待ち時間を軽減し,過剰な読取/書込演算とノード間メッセージ交換を減少させることにより入出力を加速した。アルゴリズムはスケーラブルにするために,著者らは元のためのデータセットを再構成する能力を保持しながら,分散と非決定論的様式で圧縮データを記述することを可能にする新しいタイムスタンプベースファイル構造を導入した。著者らの実験結果は,phyNGSCした最大3GB/sのスループットNGS特異的逐次圧縮機より45~98%速いことを大きなNGSデータセットの圧縮時間を達成したことを示す。著者らの理論的解析と実験結果は,いくつかのデータセット超線形スピードアップと一定の効率が得られた強いスケーラビリティを示唆した。連続走行NGS特異的圧縮アルゴリズムで撮影した5時間以上と比較して8分でデータの1テラバイトを圧縮することができた。他の並列解法と比較して,phyNGSCは6倍の高速化を達成したより高い圧縮比を維持した。この実装のためのコードであるhttps://github.com/pcdslab/PHYNGSCで利用可能である。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  計算理論  ,  言語プロセッサ 

前のページに戻る