抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
動機付け蛋白質言語モデルは,最先端の予測方法に有用な表現への蛋白質配列の意味論を要約することが示されている。しかし,抗体特異的問題のためには,配列誤差により失われた残基を復元するので,抗体のみに訓練されたモデルはより強力である。抗体は,そのような言語モデルに必要な配列データの容積が利用可能な,例えば,観察抗体空間(OAS)データベースで利用できる数少ない蛋白質タイプの1つである。結果:ここでは,OASデータベースの抗体配列で訓練された言語モデルであるAbLangを導入した。抗体配列データにおける欠損残基を回復するためにそれを用いてAbLangのパワーを実証し,B細胞受容体レパートリー配列による重要課題であり,OAS配列の40%以上が最初の15アミノ酸を欠いている。AbLangは,IMGT生殖系列または一般蛋白質言語モデルESM-1bを用いるよりも,抗体配列の欠損残基を回復させる。さらに,AbLangは抗体の生殖系列の知識を必要とせず,ESM-1bよりも7倍速い。アベイラビリティと実装AbLangは,https://github.com/oxpig/AbLangで利用可能なpythonパッケージである。【JST・京大機械翻訳】