Pat
J-GLOBAL ID:201803004758135994

遺伝子配列バリアントの病原性を予測する方法

Inventor:
Applicant, Patent owner:
Agent (5): 山本 秀策 ,  森下 夏樹 ,  飯田 貴敏 ,  石川 大輔 ,  山本 健策
Gazette classification:公表公報
Application number (International application number):2017566360
Publication number (International publication number):2018527647
Application date: Jun. 22, 2016
Publication date: Sep. 20, 2018
Summary:
費用効果が大きいDNA配列決定の最近の発展は、遺伝子配列バリアントについての対象の個別化されたゲノムスクリーニングを可能にする。半教師あり訓練方法を使用して病原性予測モデルを訓練することは、試験遺伝子配列バリアントの病原性を予測するためのより良好なモデルを提供する。本明細書は、ラベル付き良性遺伝子配列バリアントと、良性遺伝子配列バリアントと病原性遺伝子配列バリアントの混合物を含むラベルなし遺伝子配列バリアントとを含む訓練データセットを利用することによって試験遺伝子配列バリアントの病原性を予測する方法を提供する。遺伝子配列に1つまたは複数の特徴をアノテートし、機械学習モデルは半教師ありプロセスで訓練データに基づいて訓練される。次いで、試験遺伝子配列に1つまたは複数の特徴を使用してアノテートし、試験遺伝子配列バリアントが病原性である確率を訓練された機械学習モデルに基づいて予測する。
Claim (excerpt):
試験遺伝子配列バリアントの病原性を予測するためのコンピュータ実装方法であって、 少なくとも1つのプロセッサおよびメモリを有する電子デバイスにおいて、 (a)ラベル付き良性遺伝子配列バリアントを含む第1のデータセットと、 ラベルなし遺伝子配列バリアントを含む第2のデータセットであって、前記ラベルなし遺伝子配列バリアントが良性遺伝子配列バリアントと病原性遺伝子配列バリアントの混合物を含む、第2のデータセットとを 含む訓練データを受信するステップ; (b)前記第1のデータセットおよび前記第2のデータセット内の各遺伝子配列バリアントに1つまたは複数の特徴をアノテートするステップ; (c)機械学習モデルを前記訓練データに基づいて訓練するステップであって、前記機械学習モデルが半教師ありプロセスで訓練されるステップ; (d)前記試験遺伝子配列バリアントに前記1つまたは複数の特徴をアノテートするステップ;ならびに (e)訓練後に、前記機械学習モデルに基づいて、前記試験遺伝子配列バリアントが病原性である確率を予測するステップ を含む方法。
IPC (3):
G06F 19/24 ,  G06N 99/00 ,  C12Q 1/680
FI (3):
G06F19/24 ,  G06N99/00 153 ,  C12Q1/6809 Z
F-Term (9):
4B063QA13 ,  4B063QA19 ,  4B063QQ02 ,  4B063QR08 ,  4B063QR32 ,  4B063QR35 ,  4B063QS25 ,  4B063QS34 ,  4B063QX02

Return to Previous Page