Pat
J-GLOBAL ID:201403042872505024
網羅的ゲノムワイドSNP情報に基づくエピスタシス効果の探索アルゴリズム
Inventor:
,
,
,
,
Applicant, Patent owner:
,
Agent (3):
宮崎 昭夫
, 石橋 政幸
, 緒方 雅昭
Gazette classification:特許公報
Application number (International application number):2009070753
Publication number (International publication number):2010224815
Patent number:5413952
Application date: Mar. 23, 2009
Publication date: Oct. 07, 2010
Claim (excerpt):
【請求項1】 コンピュータを用い50万箇所以上におよぶゲノムワイドな一塩基多型(SNP)のジェノタイプデータから、2値のクラスを有する表現型に対して、主効果が確認されない場合でも相乗的相互作用(エピスタシス効果)を有するSNPのペアーを網羅的に同定するデータ解析方法であって、
(1)2種類のクラスの表現型を有するN個の検体から観測された総計M個(Mは50万以上)のSNPのジェノタイプデータと各検体に対応する表現型のクラスを入力する入力ステップと、
(2)前記入力ステップ(2)を介して入力されたN個の検体の表現型のクラスと総計M個のジェノタイプデータを、記憶手段に記憶する記憶ステップと、
(3)前記記憶ステップ(2)によって、記憶手段に記憶されているi番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を算出し、算出したマイナーアレル計数を基にi番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算ステップと、
(4)前記演算ステップ(3)において、解析対象SNPとして「解析継続適」と判定された場合は、算出した計数を基にi番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定し、解析継続の適否および優性型・劣性型に関する判定結果を内部記憶装置に記憶する記憶ステップと、
(5)前記ステップ(4)において、統計的手段よって判定された、優性型・劣性型に関する判定結果に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性型・劣性型が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する指標を算出し、この指標を基にエピスタシス効果の有無を判定する演算ステップと、
(6)前記演算ステップ(5)によって、「エピスタシス効果有り」と判定された場合に、2つのSNPに対する「エピスタシス効果有り」の判定結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し前記ステップ(4)に戻り、j+1番目のSNPの優性型・劣性型を統計的手段により判定し前記ステップ(3)の計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択する解析ステップと
(7)前記演算ステップ(5)において、「エピスタシス効果有り」と判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う演算ステップと
を備えており、
前記ステップ(3)に記載する、
i番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算において、「i番目のSNPの解析継続の適否」は、以下の手順に従って判定される;
各SNPのジェノタイプデータは、母由来および父由来の2つ塩基のタイプにより、集団中において2種のホモ接合体と、1種のヘテロの接合体の計3種類に分類される。ここでは、これらの2種のホモ接合体をAA、とaa、1種のヘテロ接合体をAaで表現する;
さらに、a11、a12、a13を、それぞれ検体総数がn1である表現型1のクラスにおけるジェノタイプAA、Aa、aaでの計数とし、a21、a22、a23を、それぞれ検体総数がn2である表現型2のクラスにおけるジェノタイプAA、Aa、aaでの計数とする;
演算装置で実行される前処理ステップとしてのスクリーニングにおいて、「i番目のSNPの解析継続の適否」の判定は、
a11、a12、a13、 a21、a22、a23が、以下の(I)〜(IV)の条件をどれか一つでも満たす時に、「解析継続否」と判定し、
「解析継続否」と判定されたSNPは、ステップ(4)以降の解析から除外する
(I)a11 + a12 ≦1 または a11+ a13 ≦1 または a12+ a13 ≦1 (式1)
(II)a21 + a22 ≦1 または a21+ a23 ≦1 または a22+ a23 ≦1 (式2)
(III)a11 = 0 かつ a23 = 0 (式3)
(IV)a13 = 0 かつ a21 = 0 (式4)
前記ステップ(5)に記載する、
「エピスタシス効果の有無」の判定においては、
判定の対象である、「第i番目のSNPと第j番目のSNP」の組み合わせについて、
下記の手順に従って、指標として、R1=(x11x22)/(x12x21)とR2=(y11y22)/(y12y21)を算出し、
算出した指標に基づく、「エピスタシス効果の有無」の判定では、
指標:R1=(x11x22)/(x12x21)とR2=(y11y22)/(y12y21)が、
R1=(x11x22)/(x12x21) ≧ w1 かつ R2=(y11y22)/(y12y21) ≦ 1/w2 (式5)
上記の式を満足する場合に、
「エピスタシス効果有り」と判定する;
なお、上記の(式5)においてx11、x22、x12、x21、y11、y22、y12、y21は、下記の手順に従って、算出される。
また、上記の(式5)においてx11、x22、x12、x21は、表現型がクラス1における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
同様に、y11、y22、y12、y21、は、表現型がクラス2における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
優性型とは、表現型のクラス1に対して、AAとAaのジェノタイプが関連するモデルで、A1=(AA,Aa)、A2=(aa)と記載される。また、劣性型とは、表現型のクラス1に対して、aaのジェノタイプが関連するモデルで、A1=(AA)、A2=(Aa,aa)と記載される。第j番目のSNPの優性型については、BBとBbのジェノタイプが関連するモデルで、B1=(BB,Bb)、B2=(bb)と記載される。また、第j番目のSNPの劣性型とは、表現型のクラス1に対して、bbのジェノタイプが関連するモデルで、B1=(BB)、B2=(Bb,bb)と記載される。
このとき、表現型がクラス1である検体に対して、c11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、c12をAAとBbを有する検体の計数、c13をAAとbbを有する検体の計数とする。同様に、c21をAaとBB、c22をAaとBb、c23をAaとbb、c31をaaとBB、c32をaaとBb、c33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
c11+c12+c13+c21+c22+c23+c31+c32+c33=n1 (式6)
表現型がクラス2である検体に対して、d11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、d12をAAとBbを有する検体の計数、d13をAAとbbを有する検体の計数とする。
同様に、d21をAaとBB、d22をAaとBb、d23をAaとbb、d31をaaとBB、d32をaaとBb、d33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
d11+d12+d13+d21+d22+d23+d31+d32+d33=n2 (式7)
優性型・劣性型に関する判定結果に基づき、
具体的に、x11、x22、x12、x21、y11、y22、y12、y21は、下記のように場合分けして与えられる。
(i) 第i番目のSNPが優性型、第j番目のSNPが優性型
x11=c11+c12+c21+c22, x12=c13+c23, x21=c31+c32, x22=c33,
y11=d11+d12+d21+d22, y12=d13+d23, y21=d31+d32, y22=d33 (式8)
(ii) 第i番目のSNPが優性型、第j番目のSNPが劣性型
x11=c11+c21, x12=c12+c13+c22+c23, x21=c31, x22=c32+c33,
y11=d11+d21, y12=d12+d13+d22+d23, y21=d31, y22=d32+d33 (式9)
(iii) 第i番目のSNPが劣性型、第j番目のSNPが優性型
x11=c11+c12, x12=c13, x21=c21+c22+c31+c32, x22=c23+c33,
y11=d11+d12, y12=d13, y21=d21+d22+d31+d32, y22=d23+d33 (式10)
(iv) 第i番目のSNPが劣性型、第j番目のSNPが劣性型
x11=c11, x12=c12+c13, x21=c21+c31, x22=c22+c23+c32+c33
y11=d11, y12=d12+d13, y21=d21+d31, y22=d22+d23+d32+d33 (式11)
優性型・劣性型に関する判定結果に基づき、上記の(i)〜(iv)のいずれかで与えられる、x11、x22、x12、x21、y11、y22、y12、y21から、指標:(x11x22)/(x12x21)と(y11y22)/(y12y21)を算出する。
なお(式5)に記載のw1とw2は、以下の範囲で指定される。
n1-3≦w1≦(n1/2-1)2 , n2-3≦w2≦(n2/2-1)2 (式12)
その際、上記(式5)に記載のw1とw2は、(式12)に記載する範囲で指定されるため、w1とw2は(式13)に示す最も緩やかな条件で指定する
w1=n1-3 , w2=n2-3 (式13)
ことを特徴とするデータ解析方法。
IPC (2):
G06F 19/18 ( 201 1.01)
, C12N 15/09 ( 200 6.01)
FI (2):
G06F 19/18
, C12N 15/00 A
Article cited by the Patent:
Return to Previous Page