用HaploView进行SNP统计分析的详细方法如下:
1. 软件下载和相关文献
HaploView的下载地址:https://www.broadinstitute.org/scientific-community/science/programs/medical-and-population-genetics/haploview/haploview。该网页也包含了该软件的基本介绍和功能,网页的最下部就给出了三篇文章,以供引用和参考。大家根据用到的功能进行引用即可。
2. 数据准备和导入
(1).ped和.info文件的制作,可以直接新建一个txt文档,然后把后缀名改成相应的ped和info即可;
(2)数据的编排最好在excel中进行,会方便和简易很多,直接在txt里面排也可以,但会很麻烦;
3. Case-control association study参数选择和结果解读
(1)两个必要文件做好之后,打开软件,在data file出导入.ped文件,软件会自动导入同一个文件夹里的同名的.info文件,case-control研究勾选“Do association test”--“Case/control data”--点击“ok”,结果就出来了;
(2)在弹出来的“Check makers”界面,可以看到基本的信息,target SNP ID,HWpval,MAF等;
点击“association”选项卡,即可看到associated allele,及其相对应的case和control的frequency,chi-square test,p-value(如果是多个SNP的研究,这是校正前的p-value,想做multiple tests,就用下面的permutations);
点击“Permutation tests”,在方框中输入你想做的tests的次数,然后点击“Do permutations”,计算完之后结果就会显示在下面。
4. TDT与Case-control的不同之处
(1)选择计算模式:导入数据后,选择“Do association test”--“Family trio data”--“OK“,就会出结果;
(2)结果显示:"Check markers"界面最顶端,会显示你导入有多少个family,可以看是否跟你的数据一致,如果不一致就要回去检查你的数据录入时哪里出错了。其它结果显示跟case-control差不多,不再赘述;
5. LD block的制作和分析
(1)如果你录入的数据里包含2个以上的SNP的数据,在HaploView中是可以做haplotype analysis的,但需要注意Haploview默认是忽略距离大于500KB的两个SNPs的haplotype的,因为即使算出来在遗传学上也没有太大意义;当然如果你想做的话,记得改一下这个距离限制;
(2)软件操作跟以上两小点没有区别,只是得到结果之后,在”LD plot“中会显示相应的SNP的组合,并在“haplotypes”中显示可能的组合,并在“association”--“haplotypes”显示相应的p-value;当然你可以通过改变方框的包含SNPs而认为地改变SNPs的组合,并得到相应的p-value;
(3)Permutation tests:在“association”--“Permutation tests”中可以选择“Single markers and haplotypes in blocks”,然后在后面的方框中输入你想要做的次数,即可得到单个SNPs和每种haplotypes的校正后的p-value。
6. HaploView的其它功能
这次只是讲了Haploview的最基本的做SNP统计分析的功能,除了能识别linkage format之外,你还可以通过选择其它选项卡,导入你准备好的不同format的文件。当然haploview还有其它的很多好用的功能,值得大家去探索,具体可以参照该网站的Manual进行尝试。如“HapMap download”功能,它允许只输入特定gene或区域的chromosome position,然后根据不同的人群做出相应的LD Block。