プレプリント
J-GLOBAL ID:202202212958220865   整理番号:22P0024466

遠い監視と信頼較正バイオBERTによる大規模蛋白質-蛋白質翻訳後修飾抽出【JST・京大機械翻訳】

Large-scale protein-protein post-translational modification extraction with distant supervision and confidence calibrated BioBERT
著者 (5件):
資料名:
発行年: 2022年01月06日  プレプリントサーバーでの情報更新日: 2022年01月06日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
蛋白質-蛋白質相互作用(PPI)は正常な細胞機能に重要であり,多くの疾患経路に関連する。しかし,PPIのわずか4%はIntActのような生物学的知識データベースにおいてPTMで注釈付けされ,主に手動のキュレーションにより実行され,時間もコストも効果的でない。著者らはIntAct PPIデータベースを用いて,相互作用蛋白質対,対応するPTM型,およびPubMedデータベースからの関連抽象で注釈付けされた遠隔教師つきデータセットを作成した。バイオBERTモデルのアンサンブルを訓練し,信頼キャリブレーションを改善するためにPPI-BioBERT-x10を埋め込んだ。高信頼予測を抽出するためにクラス不均衡の影響を打ち消すために,信頼変化によるアンサンブル平均信頼手法の使用を拡張した。試験セットで評価したPPI-BioBERT-x10モデルは,中程度のF1-ミクロ41.3(P=58.1,R=32.1)をもたらした。しかし,高信頼と低変動を結合することにより,高精度予測を同定でき,精度の予測を調整すれば,100%精度の試験予測の19%を保持した。PPI-BioBERT-x10を18百万のPubMed抄録で評価し,1.6百万(546507のユニークなPTM-PPI三重項)PTM-PPI予測とフィルター5700(4584のユニークな)高信頼予測を抽出した。5700のうち,小さなランダムにサンプリングされたサブセットに関するヒト評価は,信頼性較正にもかかわらず,精度が33.7%に低下し,信頼キャリブレーションでも試験セットを超えた一般化可能性の課題を強調することを示した。多重論文に関連した予測を含むだけでこの問題を回避し,58.8%の精度を改善した。本研究では,実践における深層学習ベーステキストマイニングの利益と課題を強調し,また,ヒューマンキュレーション努力を容易にするための信頼較正への強調の必要性を強調した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子・遺伝情報処理  ,  蛋白質・ペプチド一般 

前のページに戻る