特許
J-GLOBAL ID:201803004758135994
遺伝子配列バリアントの病原性を予測する方法
発明者:
,
,
,
出願人/特許権者:
代理人 (5件):
山本 秀策
, 森下 夏樹
, 飯田 貴敏
, 石川 大輔
, 山本 健策
公報種別:公表公報
出願番号(国際出願番号):特願2017-566360
公開番号(公開出願番号):特表2018-527647
出願日: 2016年06月22日
公開日(公表日): 2018年09月20日
要約:
費用効果が大きいDNA配列決定の最近の発展は、遺伝子配列バリアントについての対象の個別化されたゲノムスクリーニングを可能にする。半教師あり訓練方法を使用して病原性予測モデルを訓練することは、試験遺伝子配列バリアントの病原性を予測するためのより良好なモデルを提供する。本明細書は、ラベル付き良性遺伝子配列バリアントと、良性遺伝子配列バリアントと病原性遺伝子配列バリアントの混合物を含むラベルなし遺伝子配列バリアントとを含む訓練データセットを利用することによって試験遺伝子配列バリアントの病原性を予測する方法を提供する。遺伝子配列に1つまたは複数の特徴をアノテートし、機械学習モデルは半教師ありプロセスで訓練データに基づいて訓練される。次いで、試験遺伝子配列に1つまたは複数の特徴を使用してアノテートし、試験遺伝子配列バリアントが病原性である確率を訓練された機械学習モデルに基づいて予測する。
請求項(抜粋):
試験遺伝子配列バリアントの病原性を予測するためのコンピュータ実装方法であって、
少なくとも1つのプロセッサおよびメモリを有する電子デバイスにおいて、
(a)ラベル付き良性遺伝子配列バリアントを含む第1のデータセットと、
ラベルなし遺伝子配列バリアントを含む第2のデータセットであって、前記ラベルなし遺伝子配列バリアントが良性遺伝子配列バリアントと病原性遺伝子配列バリアントの混合物を含む、第2のデータセットとを
含む訓練データを受信するステップ;
(b)前記第1のデータセットおよび前記第2のデータセット内の各遺伝子配列バリアントに1つまたは複数の特徴をアノテートするステップ;
(c)機械学習モデルを前記訓練データに基づいて訓練するステップであって、前記機械学習モデルが半教師ありプロセスで訓練されるステップ;
(d)前記試験遺伝子配列バリアントに前記1つまたは複数の特徴をアノテートするステップ;ならびに
(e)訓練後に、前記機械学習モデルに基づいて、前記試験遺伝子配列バリアントが病原性である確率を予測するステップ
を含む方法。
IPC (3件):
G06F 19/24
, G06N 99/00
, C12Q 1/680
FI (3件):
G06F19/24
, G06N99/00 153
, C12Q1/6809 Z
Fターム (9件):
4B063QA13
, 4B063QA19
, 4B063QQ02
, 4B063QR08
, 4B063QR32
, 4B063QR35
, 4B063QS25
, 4B063QS34
, 4B063QX02
前のページに戻る