下一代测序 (Next-Generation Sequencing,NGS) 是一种高通量方法,可以对DNA或RNA样本中的碱基对进行快速测序。 支持各种应用,包括基因表达谱分析、染色体计数、检测表观遗传变化和分子分析,NGS可促进发现和实现未来的个体化医学。
一、下一代测序(Next-Generation Sequencing,NGS)研究领域
1、遗传疾病研究
从靶向基因检测板到RNA表达和非整倍性检测
2、HLA分型
基因分型I级和II级位点
3、癌症研究
从基础到转化,再到临床研究
4、传染病
从病毒到微生物群落
5、NGS工作流程和数据管理
在一个平台上管理并跟踪NGS或Sanger测序的基因组数据。
6、其他NGS研究领域
靶向DNA测序、靶向RNA测序、外显子组测序、转录组测序、微生物测序、农业基因组学、从头测序、病毒分型、细菌分型、非整倍性和CNV分析、小RNA测序和miRNA测序
二、下一代测序(Next-Generation Sequencing,NGS)的应用
WGS正在成为 NGS中最广泛的应用。通过该技术并且结合生物学应用,研究人员可以获得基因组信息中最值得注意的信息73. 举例来说,2012年,Ellis等报道了基因与乳腺癌患者芳香酶抑制剂(aromatase inhibitor)治疗法之间的关联。他们指出突变,后果与诊断之间的关联,同样还有癌症相关基因的突变的富集。这提供了一个可能性,即:乳腺癌有不同的突变造成不同的表型,具有复杂的病理学75. 最近的NGS平台的改进使得研究人员发现了一些几年前难以想象的新观点与机会。在2010年,1000基因组计划(1000 genomes project)开放了其从179个个体中获得的 WGS原始数据以及697个个体的测序数据76. 到2015年,研究人员已经构建了26个不同人群的2504个人的基因组群体77,78. 给人们从种群的角度来观察人类的变异。但这还不是该项目的终点,越来越多的人的基因组正在被得以测序79-81. 种群水平的测序已经成为人们更好的理解人类疾病的一个重要的工具,同样也得到了意想不到的结果。一个例子是,Sidore等82对2120个撒丁岛人(Sardinians)的WGS研究发现了一些新的和脂肪相关的基因以及炎症的标志物,给人们对血液胆固醇的分子机制的研究提供了新思路。
全外显子组测序(Whole-exome and targeted sequencing)83同样也广泛应用于测序的研究中。受制于基因组材料大小的局限,很更多的个人样本可以在一个测序中实现,增加了基因组研究的宽度以及深度。使用外显子测序,Iossifov84等对超过2500个单一的家庭进行测序,每个家庭都有一个小孩患有自闭症(autism spectrum disorder, ASD)。研究人员在30% 的样本中发现了错意突变(missense mutations),基因干扰的突变(gene-disrupting mutations)以及拷贝数的变异。该工作与其他的工作一道鉴定到了ASD相关的基因突变85,86. 其他证据表明,高覆盖度的WGS也可以解决复杂的变异以及临床样本的分析。2015年,Griffith等认为可以使用一个完美的跨平台的方法(包含靶向测序)来鉴定肿瘤中高可信度的SNPs. 该方法中,作者认为10000×的覆盖度可以鉴定到稀有突变。由于10000×的覆盖度对于WGS而言实在过高,靶向测序便在临床中得到了广泛的应用。
NGS同样在基因的调控研究中有广泛的应用。蛋白-DNA互作可以通过染色质免疫共沉淀结合NGS测序(ChIP-seq)来得以研究41. 利用NGS对修饰碱基的研究也是可行的。举例来说,甲基化测序包含了甲基化DNA的捕获与富集88, 对甲基化与非甲基化区段的选择性消化89,90,91. 但是,尽管利用此方法获得了很多重大的发现,修饰与捕获过程成为其最大的限制。2010年,Flusberg等92发表了一个概念性的研究方法,即:使用PacBio来区分甲基化与非甲基化的碱基。由于聚合酶即便是甲基化的碱基也能够延伸,但在甲基化位点上会停留更多的时间,因此这里改变的信号可以认为含有甲基化修饰。与之相同的是,nanopore平台也能够监测修饰的碱基,因为甲基化同样会影响鉴定到的电压的变化。这使得甲基化的测序可以在不需要化学操作的条件下进行93.
一个最近的NGS的范例是对长链DNA的测序。重复序列以及复合序列长久以来较难以拼接,短读长测序很难解决这个问题94-96. 最近,Chaisson等97对长读长测序的使用使得其能够在人类GRCh37数据库中提交超过 1Mb的新的序列,这些序列弥补甚至跨越了曾经的沟。Chaisson等还鉴定到了大于26000个超过50bp的indels, 也因此,GRCh37数据库成为最有参考价值的几个基因组之一。除了简单的增加基因组数据可靠性之外,长读长还能够提供更有效的临床诊断98-100.
在对转录水平上的研究也因为NGS受益匪浅。今天,研究人员甚至能够使用NGS的深度测序对单个转录本进行研究。2014年,Treutlein等101使用了组织发育过程中不同细胞类群的单细胞RNA测序发现了用于鉴定细胞亚群的标志物。尽管长读长测序相对而言在对转录本的定量上不占优势,但是,长读长可以在研究转录组的结构上有所帮助51. 举例来说,最近的人类长读长转录组测序研究表明 >10% 的reads是新的可变剪切体 102.
NGS 最新的设备——nanopore测序仪,依然在寻找其定位的过程中。然而,研究人员正在将其快速的文库制备,实时的数据生产以及小的体积的优势转变为资本过程中。最近,英国 Stanley Royd Hospital 的研究人员使用 MinION 用于监测沙门氏菌(Salmonella enterica)的爆发 103.MinION 测序仪最令人振奋的应用可能就是 2014年的埃博拉病毒爆发 104. 在位于日内瓦的欧洲移动实验室的主持下,作者对埃博拉病毒的传播以及进化历史进行了深入的研究。