30

找变异的流程

找变异简单点说,就是把高通量测序得到的成千上万条序列片段比对到合适的参考基因组,找到那些成

功比对的片段与参考基因组的微小差异情况。 那么就涉及到存储测序数据的fastq数据格式,比对的工具,比对后的sam格式,找微小差异的工具,差异结果的vcf文件,每个步骤的软件选择,参数 调整。当然,最重要的是走通整个流程,明白自己在做什么。

Continue reading

26

ESCC-肿瘤空间异质性探究

ESCC-肿瘤空间异质性探究

肿瘤异质性包括空间异质性时间异质性、解剖异质性、结构异质性、基因异质性和功能异质性等等

肿瘤异质性是恶性肿瘤的特征之一,是指肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出分子生物学或基因方面的改变,从而使肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等各方面产生差异。肿瘤异质性一直是肿瘤治疗的挑战之一,肿瘤内部不同亚群的细胞对药物敏感性的不同可能会导致治疗的失败。现在主流的探究肿瘤异质性的方法是:

  • 对肿瘤病人的肿瘤组织进行不同时间点取样
  • 对肿瘤病人的肿瘤组织不同部分分别取样

Continue reading

21

肿瘤全外显子测序数据分析流程大放送

这个一个肿瘤外显子项目的文章发表并且公布的公共数据,我这里给出全套分析流程代码。只需要你肯实践,就可以运行成功。

PS:有些后起之秀自己运营公众号或者博客喜欢批评我们这些老人,一味的堆砌代码不给解释,恶意揣测我们是因为不懂代码的原理。我表示很无语,我写了3千多篇教程,如果一篇篇都重复提到基础知识,我真的做不到。比如下面的流程,包括软件的用法,软件安装,注释数据库的下载,我博客都说过好几次了,直播我的基因组系列也详细解读过,我告诉你去哪里学,你却不珍惜,不当回事,呵呵。

Continue reading

17

一文学会WGCNA分析

WGCNA 分析

基本概念

WGCNA其译为加权基因共表达网络分析。该分析方法旨在寻找协同表达的基因模块(module),并探索基因网络与关注的表型之间的关联关系,以及网络中的核心基因。

适用于复杂的数据模式,推荐5组(或者15个样品)以上的数据。一般可应用的研究方向有:不同器官或组织类型发育调控、同一组织不同发育调控、非生物胁迫不同时间点应答、病原菌侵染后不同时间点应答。 Continue reading

03

癌症基因的somatic mutation calling 流程的评价体系

癌症基因的somatic mutation calling 流程的评价体系

文章是:A comprehensive assessment of somatic mutation detection in cancer using whole-genome sequencing

WGS已经逐步走入临床,ICGC目前支持了74个国际项目,刻画了两万五千个癌症患者的基因组特性,希望能因此探究癌症的生物学机制。但对这些数据的分析缺乏严格论证的标准,不同的分析者有着自己独特的分析流程。

Continue reading

03

TCGA CNV全攻略

TCGA CNV全攻略

明白什么是CNV

对正常人来说,基因组应该是二倍体的,所以凡是测到非2倍体的地方都是CNV。但是CNV本身就是人群遗传物质多样性的体现,所以对癌症样本来说,是需要过滤掉正常人体内的germline的CNV,得到somatic的CNV。

Continue reading