プレプリント
J-GLOBAL ID:202202212537052750   整理番号:22P0314601

折畳み予測のための蛋白質言語モデル埋込みの解析【JST・京大機械翻訳】

An Analysis of Protein Language Model Embeddings for Fold Prediction
著者 (3件):
資料名:
発行年: 2022年02月10日  プレプリントサーバーでの情報更新日: 2022年02月10日
JST資料番号: O7001B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
蛋白質折畳みクラスの同定は構造生物学における挑戦的な問題である。折りたたみ予測のための最近の計算法は,入力源として多重配列アラインメント(MSA)の形で進化的情報を用いて主に蛋白質折畳み表現埋込みを抽出するための深層学習技術を利用する。対照的に,蛋白質言語モデル(LM)は,自己監督された方法で純粋に連続した情報から効率的な蛋白質表現(蛋白質-LM埋込み)を学習する能力により,その分野を再構成する。本論文では,折畳みラベルで教師つきに訓練されたいくつかの微調整ニューラルネットワークモデルへの入力として事前訓練蛋白質-LM埋込みを用いた蛋白質折畳み予測のフレームワークを解析した。特に,6つの蛋白質-LM埋込みの性能を比較した:LSTMベースのUniRepとSeqVec,および変圧器ベースのESM-1b,ESM-MSA,ProtBERT,およびProtT5;3つのニューラルネットワーク,即ち,Multi-Layer Perceptron(MLP),ResCNN-BGRU(RBG),およびLight-Attention(LAT)。よく知られたベンチマークデータセット上でペアワイズ折畳み認識(PFR)と直接折畳み分類(DFC)タスクを別々に評価した。結果は,変圧器ベースの埋込み,特にアミノ酸レベルで得られたもの,RBGとLATの微調整モデルの組合せが,両方のタスクにおいて著しく良好に機能することを示した。予測精度をさらに高めるために,PFRとDFCのためのいくつかのアンサンブル戦略を提案し,現在の最先端の結果に対して顕著な性能ブーストを提供した。これは,従来の蛋白質表現から蛋白質-LM埋込みへの移動が蛋白質折畳み関連タスクへの非常に有望なアプローチであることを示唆する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
分子構造 

前のページに戻る