抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
モチベーション長読は,マッピングへの新しい挑戦を示す。そのような課題の一つは,高い配列誤差と突然変異率のため,読取と参照の間の低い配列類似性である。これは,例えば癌腫瘍において,または,ウイルスまたは細菌の菌株間の差異に起因する。マッピングアルゴリズムにおける重要なアイデアは,それらの最小化者によるシーケンスをスケッチすることである。最近,突然変異および配列決定エラーに対してよりロバストである代替スケッチング法としてシンセマーを導入した。【結果】著者らは,パラメータ化syncmer方式,syncmersの一般化を導入し,マルチパラメータ方式のための理論解析を提供する。これらの方式をダウンサンプリングまたは最小化器と組み合わせることにより,任意の望ましい圧縮とウィンドウ保証を達成できる。ポピュラーなミニマップ2とWinnowmap2マップにおけるパラメータ化シンマー方式の利用を実行した。種々のゲノムからのシミュレーションおよび実際の長い読取データに関する試験において,理論解析に基づいて選択したスキームパラメータを有するシンマーベースのアルゴリズムは,通常,より少ないメモリを用いて,高い圧縮で20~60%まで非写像読取を縮小した。利点は,低い配列同一性でより顕著であった。75%と中程度の圧縮のシーケンス同一性において,syncmer-minimapは,多くの非マッピング読取りとして37%だけであり,そして,地図をマッピングした読取の8%は,不正確にマッピングされた。より低い圧縮とエラー率でさえ,パラメータ化されたシンマーベースのマッピングは,元のシンメーラー方式を用いたマッパーと同様に,元の最小化器ベースのマッパーより,より多くの読取をマッピングした。パラメータ化シンセマースキームを用いることは,広範囲の設定における長い読取のマッピングを改善できると結論した。アベイラビリティhttps://github.com/Shamir Lab/syncmer_mapping補足情報補足データはhttps://github.com/Shamir Lab/syncmer_mappingで利用可能である。Author要約Popular longed Mappersは,アラインメントシードとして重複ウィンドウから最小ハッシュk-mersを最小化した。最近の研究により,種子としてk-merの固定セットを選択するシンマーは,誤差または突然変異の下で,最小化者よりも保存されやすく,エラー傾向のある長い読影をマッピングするのに潜在的に有用であることを示した。これまでに導入したものを一般化し,それらの特性の理論的解析を提供する,パラメータ化されたシンマースキームと呼ぶ,シンマーを生成するフレームワークを導入した。ミニマップ2とWinnowmap2長読取マッパーにおいて,パラメータ化シンマー方式を実行した。理論解析に基づいて選択したパラメータを用いて,様々なシミュレーションおよび実際のデータセット上で,少ないマッピングおよび不正確なマッピングされた読取を用いて,改善されたマッピング性能を実証した。改善は広範囲の圧縮速度及び配列同一性にわたって一致し,低配列同一性(高誤差又は突然変異率)及び高圧縮に対する最も顕著な改善を有した。【JST・京大機械翻訳】