プレプリント
J-GLOBAL ID:202202207472849130   整理番号:22P0326322

GenMPI:Short/Long Readsシーケンシングデータのためのクラスタスケーラブル可変呼び出し【JST・京大機械翻訳】

GenMPI: Cluster Scalable Variant Calling forShort/Long Reads Sequencing Data
著者 (1件):
資料名:
発行年: 2022年04月05日  プレプリントサーバーでの情報更新日: 2022年04月05日
JST資料番号: O7001B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
配列決定技術の急速な技術的進歩は,費用対効果が高く,高容量の配列決定データを作り出すことを可能にする。リアルタイム臨床診断のためのこのデータを処理することは,単一計算ノード上で行うならば,潜在的に時間がかかる。本研究では,高帯域幅相互接続の利点を利用するためにメッセージパッシングインタフェイス(MPI)を用いて実装された完全バリアント呼出しワークフローを提示した。この解(GenMPI)は携帯可能で柔軟であり,任意の民間または公共クラスタ/クラウドインフラストラクチャに展開できる。任意のアラインメントまたはバリアント呼出しアプリケーションは最小適応で使用できる。高性能を達成するために,圧縮された入力データは,アラインメントアプリケーションに平行に流れ込むことができ,一方,非圧縮データは,単一ノードからのストリーミング入力データのボトルネックを除くために,内部ファイル探索機能を使用することができる。アラインメント出力は複数の染色体特異的SAMファイルまたは単一SAMファイルに直接貯蔵できる。アラインメントの後,MPI RMA(Remote Melective Access)原子演算を用いた分散待ち行列を,ソーティング,インデクシング,複製のマーキング(必要),および変異体呼出しアプリケーションのために作成した。元の単一ノード法と比較して,変異体の精度を保証した。また,300xカバレッジデータに対して,アラインメントスケールは64ノード(8192CPUコア)までほぼ線形であることを示した。全体として,本研究は,既存のビッグデータベースのワークフローを2つの因子で凌駕し,余分なメモリオーバヘッドのないアラインメントのための他のMPIベースの実装よりもほぼ20%高速である。ソーティング,インデクシング,複製除去,およびバリアント呼出しも8ノードクラスタまでスケーラブルである。対端短読(Illumina)データに対して,著者らはBWA-MEMアラインメント者と3つの変異体呼称者(GATK HaplotypeCaller,DeepVariant,およびOctopus)を統合し,一方,長読者データのために,ミニマップ2アラインメント者と3つの異なる変異体呼称者(DeepVariant,DeepVariantを位相(PacBio)とClair3(ONT))を統合した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子・遺伝情報処理  ,  計算機網 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る