プレプリント
J-GLOBAL ID:202202208179395694   整理番号:22P0027015

変圧器を用いたメタゲノムデータからのバクテリオファージの正確な同定【JST・京大機械翻訳】

Accurate identification of bacteriophages from metagenomic data using Transformer
著者 (4件):
資料名:
発行年: 2022年01月12日  プレプリントサーバーでの情報更新日: 2022年08月11日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
細菌は細菌感染細菌である。微生物群集の重要なプレーヤーとして,それらは細菌宿主に感染し,遺伝子導入を仲介することにより,ミクロビオームの組成/機能を調節することができる。最近,様々なミクロビオームからすべての遺伝物質を配列できるメタゲノム配列決定は,新しいファージ発見のための一般的な手段となっている。しかし,メタゲノムデータからのファージの正確で包括的な検出は困難である。高い多様性/豊度,および限られた参照ゲノムは,メタゲノムデータからファージ断片を動員するための大きな課題を提起する。既存のアラインメントベースまたは学習ベースのモデルは,メタゲノムデータに関して低い想起または精度のいずれかを持つ。結果:本研究では,ファージコンティグに対する文脈埋め込みを行うために,最先端の言語モデル,変換器を採用した。蛋白質-クラスタ語彙を構築することにより,蛋白質組成と各コンティグから形質転換体への蛋白質位置の両方を供給できる。変圧器は,自己注意機構を用いて蛋白質組織化と会合を学習でき,試験コンティグのラベルを予測する。著者らは,品質RefSeqゲノム,短いコンティグ,模擬メタゲノムデータ,モックメタゲノムデータ,および公開IMG/VRデータセットを含む,困難の増加を伴う複数のデータセット上でPhaMerと名付けた著者らの開発したツールを厳密に試験した。。”PhaMer”は,品質RefSeqゲノム,短いコンティグ,模擬メタゲノムデータ,モックメタゲノムデータ,および公開IMG/VRデータセットを含む。すべての実験結果は,PhaMerが最先端のツールより優れていることを示した。実際のメタゲノムデータ実験では,PhaMerはファージ検出のF1スコアを27%改善した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (5件):
分類
JSTが定めた文献の分類名称とコードです
ウイルスの生化学  ,  下水,廃水の生物学的処理  ,  ウイルスの形態学,分類学  ,  ウイルスの生理一般  ,  微生物の生態 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る