系列文章
文献1.基于大规模临床队列的CNV图谱评估外显子测序和外显子CGH芯片的CNV
文章于2014年发表于Genetics in Medicine,标题是Assessing copy number from exome sequencing and exome array CGH based on CNV spectrum in a large clinical cohort,作者单位GeneDx, Gaithersburg, Maryland, USA.
研究目的:根据大规模临床患者的比较基因组杂交芯片获得致病CNV图谱,开发一种从全外显子测序数据中提取CNV的生物信息学方法,并证明其临床实用性。
文章主体内容:
- 描述大规模队列中的CNVs,获得人类基因组中的致病CNV图谱
- 14228个Exon-focused arrays的CNV情况
- 14000个全基因组CMA的CNV情况
基因内的CNV很普遍,多数CNV跨越至少1个外显子。
- 比较芯片与WES获得CNV的一致性
- 9个样本中12个芯片得到的CNV,用WES验证
- 11个样本,WES检测到的CNV,用exome aCGH验证
10X的WES已经能发现许多致病CNV,当CNV涉及多外显子时,WES的结果准确度高;当CNV只涉及1个外显子时,WES的假阳性很高,且而且重复的假阳性率>缺失;提高测序深度将提高CNV检测的准确度。
- 11个样本,WES检测到的CNV,用exome aCGH验证
- 在实际临床WES数据中检测CNV,并用芯片评估
WES检测出54个可能的致病性CNV,aCGH或MLPA或qPCR验证出34个。
文献2.拷贝数变异检测方法评论
文章于2018年发表在PlosOne,标题是A remark on copy number variation detection methods,作者单位是School of Mathematical Sciences, Peking University, Beijing, China
研究目的:比较微阵列和下一代测序技术(NGS)的高通量平台检测全基因组拷贝数丢失的准确度和一致性。
数据:254个同时具有SNP芯片和NGS数据的人类DNA样本,分别来自Hapmap Project和1000 Genomes Project,分析拷贝数丢失。
主体内容
1.不同CNV calling的一致度低
Hapmap与千人基因组(测序)比较:CNV重叠部分<30%
芯片CNVhac中与测序的重叠部分<20%
芯片CNVhac中与Hapmap的重叠部分约50%
Hapmap和千人基因组中报告的CNV都是经过实验验证的
2.在测序数据中检验CNVhac获得的拷贝数丢失区域的reads数是否显著降低
卡方检验和置换检验,仅2个样本拒绝零假设(共128个样本)。说明与正常区域相比,绝大多数报告区域具有相对低的reads深度。
3.芯片获得的拷贝数丢失候选基因的断点在测序数据中检测率高
128个样本的chr11比对文件中检测到了207个拷贝数丢失(CNVhac共报道了235个),88%的候选拷贝数丢失在测序数据中都有相应断点。
结论:
CNVhac是检测拷贝数变异的高度有效的方法。
Hapmap Project和1000 Genomes Project之间的重叠度低的原因是检测标准不一致和多平台的实验验证。(作者认为实验验证会引入较高的假阴性)微信文章:测序会取代芯片检测CNV吗?
2016年发表在Genetics in Medicine的文章Low-pass whole-genome sequencing in clinical cytogenetics: a validated approach
染色体微阵列分析chromosomal microarray analysis 即CMA(包括比较基因组杂交array-CGH和单核苷酸多态性芯片SNP-array)一直是检测致病性CNV的金标准 。
研究目的:研究全基因组低深度测序(~0.25X)在检测染色体数目及结构异常的诊断效率和可行性
数据:198例流产,37例死产,149例产前和186例产后样本进行CNV检测分析。
主要内容
1.全基因组低深度测序与已知CMA结果比较:NGS检测pCNV的敏感性及特异性均为100%,还发现了其他32个致病意义未明确的拷贝数变异
2.用自己的样本进一步评估:NGS的检测结果与CMA的结果100%一致
不管是aCGH还是基于测序深度检测CNV的低深度的全基因组测序都不能检测三倍体变异 。
资料来源文献3.前列腺癌靶向测序的拷贝数评估:分析验证和临床鉴定
2017年发表在Clin Cancer Res,Gene Copy Number Estimation from Targeted Next-Generation Sequencing of Prostate Cancer Biopsies: Analytic Validation and Clinical Qualification,作者单位The Institute of Cancer Research, London, United Kingdom
研究目的:靶向测序具有便宜、高通量、易操作的优点,但对CNA的检测尚不完善。
肿瘤样本:110个转移前列腺癌样本,来源于34位患者的种系DNA作为基线参考。
实验设计:用CNVkit检测110个前列腺组织样本的靶向NGS数据(DNA修复机器相关的基因和前列腺癌重要基因共113个)的CNV,并用基于捕获的全外显子测序、比较基因组芯片和FISH验证该方法的可行性。
结果:
在使用汇集的种系DNA作为覆盖度参考的前提下,CNA的估计准确,结果可重复度高(r=0.92)。
靶向NGS获得的CNA与WES(r=0.86)和aCGH(r=0.7)相当;一些关键基因(BRCA2, MYC, PIK3CA, PTEN, and RB1 )与WES (r = 0.91)和aCGH (r = 0.84) 的相关度更高。
该实验中的CNA频率与过去报道的类似 (i.e., deep deletions: BRCA2 4.5%; RB1 8.2%; PTEN 15.5%; amplification: AR 45.5%; gain: MYC 31.8%) 。
FISH结果还表明,CNA的评估受肿瘤异质性的影响。
总结:靶向测序和CNVkit是一套稳健、精准、高通量、经济有效的CNA检测方法文献4. 24-染色体拷贝数分析:比较目前已有的技术
文章于2013年发表Fertility & Sterility,标题是:24-chromosome copy number analysis: a comparison of available technologies.,作者单位是Bluegnome, Fulbourn, Cambridge; and Institute of Integrative and Comparative Biology, University of Leeds, Leeds, United Kingdom
评估了几种检测配子或受精卵细胞拷贝数变异的方法:染色体计数(FISH)、比较基因组杂交、比较基因组杂交芯片、PCR、SNP芯片、RT-PCR、新一代测序。
评价:比较的方向侧重于临床可用性。由于评估时间较早(2013年),芯片和测序技术还不够普及,对比较芯片与测序的CNV参考意义不大。文献5.以aCGH-array为对照比较外显子CNV检测工具
文章于2013年发表在BioMed Research International,标题是Comparative Study of Exome Copy Number Variation Estimation Tools Using Array Comparative Genomic Hybridization as Control,作者单位是Center for Quantitative Sciences, Vanderbilt University, Nashville, TN 37027, USA
数据:16种乳腺癌细胞系,HiSeq2000外显子测序,平均捕获率48%,每个样本平均117个reads。
方法:比较了4种(CoNIFER, cn.MOPS, exomeCopy, ExomeDepth)不需要配对样本作为输入的CNV检测方法,以aCGH作为标准。
主要结果:
- CNV数目:aCGH检测出的CNV数目最多,其次分别是exomeCopy、ExomeDepth、 cn.MOPS、CoNIFER。
- CNV长度分度
- 计算不同检测方法间的KL距离,比较差异性,与aCGH差异最小的是cn.MOPS。
KL距离,是Kullback-Leibler差异(Kullback-Leibler Divergence)的简称,也叫做相对熵(Relative Entropy)。它衡量的是相同事件空间里的两个概率分布的差异情况。其物理意义是:在相同事件空间里,概率分布P(x)的事件空间,若用概率分布Q(x)编码时,平均每个基本事件(符号)编码长度增加了多少比特。
KL距离越小代表差异度越小。
- 分别统计各方法获得的缺失与重复
- 各方法获得的CNV与aCGH的重叠部分,WES还检测出于aCGH相反的结果(比如aCGH检测为缺失,WES表现为重复)。cn.MOPS和CoNIFER的假阳性率更低。
结论:aCGH是检测拷贝数变异的金标准,利用WES鉴定出的CNV数量更少,敏感度低,假阳性率高且存在复制偏差。但WES鉴定CNV的效率与所调用的方法有关,cn.MOPS和CoNIFER虽然获得的CNV数目相对少,但真阳性率高。文献6.使用WES数据估计拷贝数基因型的组合方法
文章于2015年发表于Genomics,标题是Combinatorial approach to estimate copy number genotype using whole-exome sequencing data,单位是Division of Structural and Functional Genomics, Center for Genome Science, National Institute of Health, Republic of Korea
数据:80个健康韩国人(31名男性和49名女性) 的外周血样本,Illumina HiSeq 2000平台全外显子测序,平均覆盖深度60X。
方法步骤:- 用ExomeDepth和cn.MOPs检测WES数据中的CNV
- 根据结果定制芯片,进行aCGH检测。评估2种CNV calling方式的准确度
- 用CNVtools进行CNV基因分型。将分型结果与芯片和EXCAVATOR进行比较。
EXCAVATOR软件:检测WES检测的拷贝数变异。可以对CNV分型。
结果:- ExomeDepth检测到的CNV是cn.MOPs的两倍多
- ExomeDepth与aCGH获得的CNV区域重叠率62.6%,cn.MOP 的重叠率为45%
- 检验CNV基因型一致性,在缺失基因上,ExomeDepth / CNVtools方法比EXCAVATOR更精准。ExomeDepth检测缺失的真阳性率(以aCGH为真阳性)为0.84,EXCAVATOR 的真阳性率为0.36.
结论:
作者主要在全基因组测序数据中用ExomeDepth / CNVtools组合方法检测CNV,与aCGH的CNV区域重叠度62.6%;与EXCAVATOR比较,CNV分型效果更好。
WES数据可以获得相对较好的CNV检测效果,但aCGH是标准。文献7.在急性淋巴细胞白血病中靶向9p重测序与aCGH产生一致的结果,揭示了新的基因组改变
文章于2013年发表于Genomics,标题是Targeted resequencing of 9p in acute lymphoblastic leukemia yields concordant results with array CGH and reveals novel genomic alterations.,作者单位Department of Pathology, Haartman Institute and HUSLAB, University of Helsinki and Helsinki University Central Hospital, Finland.
数据:35名青少年/成人急性淋巴细胞白血病患者9p区域的靶向测序
主要目的:比较两种方法的拷贝数变化结果。揭示了ALL中新的拷贝数变化,基因突变,融合及其频率。
主要结果:- NGS检测出的拷贝数变异
- NGS与aCGH检测CNV比较
- aCGH无法检测到较小的CNV
- NGS无法检测到大/全臂缺失,因为大的缺失覆盖了几乎整个测序区域
- 分析检测到的CNV,插入/缺失,SNP,结构重排/配对末端异常
结论:NGS与aCGH检测到的CNV一致度高,但NGS在CNV检测小局部变异时具有更高的灵敏度,而aCGH更准确地检测到更大的CNV。发现了ALL中新的基因组变异。我的总结
- 长久以来芯片是检测CNV的金标准,测序的优势在于可发现新的CNV
- NGS在CNV检测小局部变异时具有更高的灵敏度,而aCGH更准确地检测到更大的CNV
- 在检测临床已知的致病CNV中,低深度的WES已经可以达到较好的效果,芯片与测序获得CNV的结果上一致度很高;但在精确比较二者间的CNV时,一致度稍差。
- 对于WES来说,不同的CNV calling会带来较大的结果差异。
- 随着测序和CNV calling技术的进步,从WES获得CNV的准确率在不断提高。