抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
背景:蛋白質の細胞内局在の予測は蛋白質の機能を推定するために不可欠である。最近の研究は1か所の蛋白質のみならず,複数の位置の蛋白質も予測することに焦点をあてている。ほとんどすべての高性能予測法は,最近,分類用の特性ベクターを構築するために遺伝子オントロジー(GO)タームを使用することを提案している。それらの高い性能にもかかわらず,それらの予測決定は,多数のGOタームが関与するため,解釈が困難である。結果:本稿は1か所と複数位置蛋白質の細胞内局在を予測して解釈することの両者のためのGO情報を利用するためにスパース回帰を用いることを提示する。具体的には,二つのマルチラベルスパース回帰アルゴリズム,すなわちマルチラベルLASSO(mLASSO)とマルチラベル弾性ネット(mEN)を,蛋白質細胞内局在の大規模予測について比較した。両アルゴリズムはスパースと解釈可能なソリューションを形成可能だった。1対残り戦略を使うことで,mLASSOとmENは8000以上のGOタームのうち87と429を同定し,細胞内局在の決定において本質的な役割を果たした。さらに興味深いことに,mENが選択したGOタームの多くは生物学的プロセスと分子機能カテゴリ由来であり,これらのカテゴリのGOタームが予測においても重要な役割を果たしていることが示唆された。これらの必須GOタームと共に,蛋白質が位置する場所を決定可能であるのみならず,それがなぜそこにあるのかを明らかにすることも可能である。結論:実験結果はmENとmLASSOの両者の出力が,解釈可能であり,それらは既存の最先端予測法よりも有意に良好に機能することを示した。さらに,mENは厳密なヒトベンチマークデータセットにおいて,mLASSOよりも多くの特徴を選択し,良好に機能した。読者の便利のため,mLASSOとmENの両者についてのSpaPredictorと呼ばれるオンラインサーバがhttp://bioinfo.eie.polyu.edu.hk/SpaPredictorServer/で利用可能である。(翻訳著者抄録)