抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
背景:バイオインフォマティクスにおける共通課題は,ゲノムまたは参照配列のセットにおいて独特の短いサブ配列を同定することであり,それはk-mer(k個の連続したヌクレオチド)の計測により効率的に達成し得る。しかし,「ユニーク」のより厳格な定義の利点を受けるいくつかの領域がある。それは長さWのこれらサブシーケンスが他のサブシーケンスと異なるk個のミスマッチ(すなわち,kより大きいハミング距離)を超えて異なることを必要とし,これをk-disjoint問題と呼ぶ。その例には,プローブに基づいた感染症診断のための病原体特有の配列の発見,再シークエンシングまたはゲノム編集のためのオフターゲットヒットの減少,挿入配列(例えばファージまたはウイルス)の検出および複数の置換突然変異が含まれる。感度と特異性の両方が重要であるため,網羅的ではあるが効率的な解法が望ましい。結果:本研究では,最大100ヌクレオチド長の独特な(k-disjoint)配列を効率的かつ大規模に配列マイニングできる方法,microTabooを開発した。微生物から哺乳類サイズのゲノムに至る多くのシミュレートした実際のデータセットについて,microTabooは他のサブシークエンスではk個のミスマッチの閾値内では生じない特定の長さWの全サブシークエンスを効率的に見つけ出すことが出来ることが分かった。microTabooには,点置換検出,シークエンス挿入検出,パドロックプローブ標的検索,そして候補CRISPR標的マイニングを含む多くの実用的なアプリケーションがある。結論:microTabooは配列比較および構築の自由な方法でk-disjoint問題の解を実装する。microTabooは,Windows,Mac OS XおよびLinuxにて,Java 7以上で実行し,GNU GPLv3ライセンスの下でhttps://MohammedAlJaff.github.io/microTabooから利用可能である(翻訳著者抄録)