文献
J-GLOBAL ID:202002240816531332   整理番号:20A0773944

蛋白質機能予測のための細菌フィラデータセット【JST・京大機械翻訳】

A bacterial phyla dataset for protein function prediction
著者 (6件):
資料名:
巻: 28  ページ: Null  発行年: 2020年 
JST資料番号: W3049A  ISSN: 2352-3409  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
蛋白質機能予測は,計算生物学者にとって最も挑戦的な問題である。既知の蛋白質の大部分はまだ実験的に特性化されておらず,それらの構造と機能の間に有意なギャップがある。膨大なペース[1]において,新しい非注釈配列を公開蛋白質データベース(例えばUniProtKB)に加えている。未知の機能を有するそのような蛋白質は,代謝,成長および発達調節において重要な役割を果たす可能性がある。したがって,未知の蛋白質の機能が発見されていないならば,研究者は重要な情報をスキップする可能性がある。それらの配列,構造,進化史,およびそれらの他の蛋白質との関連に基づいて,計算生物学のツールは,蛋白質の機能への洞察を提供することができる。良く特性化された近縁種を持つ蛋白質については,機能を推論することは自明である。識別可能な配列を持たないオーファン蛋白質は,より大きな挑戦[3]を示す。ここでは,実験的特性化のタスクはブラインドで,無wiになる。全ての既知蛋白質は,これまで完全に実験的に特性化されている可能性が高い。したがって,この要求を満たすための高速で正確な計算手法を開発することが緊急に必要である。この目的のために,9つの細菌門Actinobacteria,Bacteroidetes,Chlamyiae,藍藻類,Firmicutes,Fusobacteria,Proteobacteria,SpirochaetesおよびTenericutesに属する蛋白質配列を抽出することにより蛋白質機能予測のためのデータセットを調製した。最も頻度が高い1739遺伝子オントロジー(分子機能)に対応して,サンプルを濾過し,171,212の蛋白質を特徴生成のために検索した。データセットは,[10]における方法を用いて,各171,212のレビューされた蛋白質に対する配列,サブ配列,物理化学的,注釈に基づく特徴を計算することにより生成された。これらの特徴は,1739遺伝子オントロジー用語と共に,蛋白質の各配列に対する合計9890の属性を構成する。各蛋白質配列は,その標的標識として1739遺伝子オントロジー(分子機能)用語の1つ以上に割り当てられる。データセットは,UniProtKBデータベースに対応する各シーケンスのEntryとEntry名前を含んでいる。このデータセットはサイズが大きく(171,212サンプルX9890特徴,多重値1739クラス),各1739クラスの正および負サンプルの十分な数を備えており,任意の深い学習モデル[5]のテスト効率に対して良好である。著者らは,171,212のレビューされた蛋白質の完全なデータセットを比3:1で分割し,Train/Testデータセット1を形成した。深い学習モデルの訓練を容易にするために,128,409のサンプルと42,803のサンプルを有するテストデータセットを有する列車データセットを用いた。列車と試験データセットは,各1739クラスの良好な割合を含むように層別化されている。次に,[5]において提案された深い学習モデルを用いてそれらの機能を予測するために,再検討された蛋白質の訓練/訓練データセットと同一の9890の特徴を持つ9つの細菌門の病原性非レビュー蛋白質のデータセット2を調製した。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子構造  ,  分子・遺伝情報処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る