プレプリント
J-GLOBAL ID:202202202658658430   整理番号:22P0230820

教師なし蛋白質埋め込みは,分子機能の予測において手に手を置いた配列および構造特徴を外形する【JST・京大機械翻訳】

Unsupervised protein embeddings outperform hand-crafted sequence and structure features at predicting molecular function
著者 (6件):
資料名:
発行年: 2020年04月08日  プレプリントサーバーでの情報更新日: 2020年04月08日
JST資料番号: O7001B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
動機づけプロテイン機能予測は難しいバイオインフォマティクス問題である。多くの最近の方法は,複雑なシーケンス表現を学習し,これらから機能を予測するために,深いニューラルネットワークを使用する。深い教師つきモデルは,このタスクには利用できない多くのラベル付き訓練データを必要とする。しかし,機能的標識のない非常に大量の蛋白質配列が利用可能である。【結果】蛋白質機能予測の監督されたタスクに関する教師なし設定で事前訓練された既存の深い配列モデルを適用した。この複雑な特徴表現が,アミノ酸,k-mer数,二次構造,およびバックボーン角の1ホットエンコードのような手作業特徴を凌駕する,このタスクに対して効果的であることを見出した。また,2層パーセプトロンが機能的注釈ベンチマークの第3臨界評価において最先端の性能を達成するのに十分であるので,それは深い予測モデルの必要性を部分的に否定する。また,この配列表現を蛋白質3D構造情報と組み合わせると,性能の改善に至らず,三次元構造が教師なし予訓練中に潜在的に学習されるというヒントを得た。使用したすべてのモデルのアベイラビリティをhttps://github.com/stamakro/GCN for Structure and Functionで見つけることができた。接触的情報補足データはオンラインで利用できる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る