抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
パターン検出とストリングマッチングは,コンピュータ科学における基本的問題であり,バイオインフォマティクスと計算生物学の加速拡張は,それらを両方の分野のためのコアトピックにした。SARS-CoV-2パンデミックは,一定の変異のため,毎週発見された数百または数千の新しいゲノム変異体により,そのような問題を要求し,迅速で正確な分析の必要性がある。配列アラインメントのようなゲノム解析のための計算ツールの必要性は非常に重要であるが,ほとんどの場合,必要な資源と計算電力は莫大である。提示した多重ゲノム解析フレームワークは,テキストマイニングとパターン検出用に特に構築されるデータ構造とアルゴリズムを組み合わせて,最小資源と同時にいくつかの計算生物学とバイオインフォマティクス問題を効率的に処理するのを助けることができる。空間と時間計算量O(nlogn)を有する先進アルゴリズムの単一実行は,複数のゲノム配列に存在するすべての反復パターンに関する知識を得るために十分であり,この情報は更なるメタ解析のために他のメタアルゴリズムから使用することができる。提案フレームワークの可能性は300,000以上のSARS-CoV-2ゲノム配列の解析とこれらの配列における60ヌクレオチドまでの長さの全ての反復パターンの検出により実証された。これらの結果を用いて,すべての変異体,配列アラインメント,パリンドロームおよびタンデム反復検出,異なる生物ゲノム比較,ポリメラーゼ連鎖反応プライマー検出などの共通パターンのような質問に対する回答を提供した。【JST・京大機械翻訳】