抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スケッチ法は計算生物学者スケーラブル技術を提供し,サイズで成長し続けるデータセットを分析する。MinHashは,最近の幅広い応用を楽しむ集合類似性を推定するそのような技術である。しかし,従来のMinHashは,非常に異なるサイズのセットに適用するとき,以前,あまり実行されていないことが示されている。FracMinHashは,集合サイズが異なるとき,この性能の欠如を補償するために,MinHashの修正として最近導入された。このアプローチは,広く使用されたツール酸味料収集におけるメタゲノム分類学的プロファイリングに成功裏に適用された。実験的証拠は有望であるが,FracMinHashはまだ理論的観点から分析されていない。本論文では,FracMinHashの様々な統計量を導出するためにそのような解析を実行し,FracMinHashが不偏でない(その期待値が推定を試みているという意味において),このバイアスは格納容器とJaccard指数バージョンの両方に対して容易に修正されることを証明した。次に,FracMinHashを用いて,単純な突然変異モデルを仮定することにより,一連の配列間の進化的突然変異距離に対する信頼区間だけでなく,点推定を計算できることを示した。また,これらの解析が失敗するエッジケースを検討し,FracMinHashのユーザを効果的に警告し,このような事例の尤度を示した。著者らの解析は,FracMinHashが従来のMinHashと比較して,大きなメタゲノムにおけるゲノムの格納容器をより正確に推定し,点推定と信頼区間が突然変異距離の推定において有意に良いことを示した。【JST・京大機械翻訳】