プレプリント
J-GLOBAL ID:202202215800030952   整理番号:22P0317662

蛋白質設計のための深い教師なし言語モデル【JST・京大機械翻訳】

A deep unsupervised language model for protein design
著者 (3件):
資料名:
発行年: 2022年03月12日  プレプリントサーバーでの情報更新日: 2022年03月12日
JST資料番号: O7001B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
蛋白質設計は,スクラッチから新しい蛋白質を構築し,それによって多くの環境および生物医学的問題に取り組む可能性を保持している。自然言語処理(NLP)の分野における最近の進展は,人間のような能力でテキストを理解および生成できる,絶えず成長する言語モデルの実現を可能にした。ヒト言語と蛋白質配列の間の多くの類似性を考えると,NLPモデルの使用は,蛋白質研究における予測タスクにそれ自身を提供する。GPT-x系列のような生成形質転換体に基づく言語モデルの明白な成功により動機づけられて,著者らは,自然のものの原理に従うde novo蛋白質配列を生成する蛋白質空間で訓練された言語モデルであるProtGPT2を開発した。特に,生成した蛋白質は天然蛋白質に類似したアミノ酸傾向を示す。無秩序および二次構造予測は,ProtGPT2生成蛋白質の88%が,自然配列と一致して球状であることを示した。蛋白質データベースにおける感受性配列検索は,ProtGPT2配列が自然のものと離れて関連しており,類似性ネットワークがProtGPT2が蛋白質空間の未探索領域を抽出することを示した。ProtGPT2配列のαFold予測は,大きなループと同様に,エンボジメントを有するよく折り畳まれた非理想化構造をもたらし,現在の構造データベースで捕捉されない新しいトポロジーを明らかにした。ProtGPT2は蛋白質言語を話すために学んだ。それは,秒の物質において,ハイスループット様式でde novo蛋白質を生成する可能性を有する。モデルは使いやすく,自由に利用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子構造  ,  分子・遺伝情報処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る