抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
高次元データは科学のほぼすべての領域でますます一般的になっている。これらのデータを分析し,それらの意味を理解する方法の開発は,緊急の課題である。これは,単一細胞RNA-seq(scRNA-seq)に対して特に真実であり,数千から数百万の単細胞において数十万の遺伝子の発現を同時に測定する技術である。解析ワークフローに対する新たなコンセンサスは,細胞型の帰属のような下流解析を行う前に,データセットの次元を著しく減少させる。このアプローチによる一つの問題は,次元縮小がデータに実質的な歪みを導入することができることである。二次元マップとして三次元地球を表す試みの精通例を考察した。そのような歪がscRNA-seqデータの解析に影響を及ぼすかどうかは現在不明である。ここでは,次元縮小前後の点の局所近傍を比較することにより,この歪を定量化するための直接的手法を導入した。t-SNEおよびUMAPのような一般的な技法は,比較的単純なシミュレーションデータセットに対しても,実質的な歪みを導入することを見出した。scRNA-seqデータに対して,局所近傍における歪みは,下流解析に通常用いられる表現において95%以上であることが分かった。このレベルの歪みは,セルタイプ同定,擬似時間規則化,および他の解析に誤差を導入することができる。主成分分析は正確な埋込みを生成することができるが,scRNA-seq解析において通常用いられる次元性を用いる場合のみ,その次元を用いるときのみであることを見いだした。本研究は,その真の潜在次元において高次元データを正確に埋め込むことができる次元縮小アルゴリズムの新しい生成の必要性を示唆した。【JST・京大機械翻訳】