抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
蛋白質-蛋白質相互作用(PPI)は正常な細胞機能に重要であり,多くの疾患経路に関連する。しかし,PPIのわずか4%はIntActのような生物学的知識データベースにおいてPTMで注釈付けされ,主に手動のキュレーションにより実行され,時間もコストも効果的でない。著者らはIntAct PPIデータベースを用いて,相互作用蛋白質対,対応するPTM型,およびPubMedデータベースからの関連抽象で注釈付けされた遠隔教師つきデータセットを作成した。バイオBERTモデルのアンサンブルを訓練し,信頼キャリブレーションを改善するためにPPI-BioBERT-x10を埋め込んだ。高信頼予測を抽出するためにクラス不均衡の影響を打ち消すために,信頼変化によるアンサンブル平均信頼手法の使用を拡張した。試験セットで評価したPPI-BioBERT-x10モデルは,中程度のF1-ミクロ41.3(P=58.1,R=32.1)をもたらした。しかし,高信頼と低変動を結合することにより,高精度予測を同定でき,精度の予測を調整すれば,100%精度の試験予測の19%を保持した。PPI-BioBERT-x10を18百万のPubMed抄録で評価し,1.6百万(546507のユニークなPTM-PPI三重項)PTM-PPI予測とフィルター5700(4584のユニークな)高信頼予測を抽出した。5700のうち,小さなランダムにサンプリングされたサブセットに関するヒト評価は,信頼性較正にもかかわらず,精度が33.7%に低下し,信頼キャリブレーションでも試験セットを超えた一般化可能性の課題を強調することを示した。多重論文に関連した予測を含むだけでこの問題を回避し,58.8%の精度を改善した。本研究では,実践における深層学習ベーステキストマイニングの利益と課題を強調し,また,ヒューマンキュレーション努力を容易にするための信頼較正への強調の必要性を強調した。【JST・京大機械翻訳】