在我们生信技能树好久以前的一个教程,看到了邢老师的留言,如下: Continue reading
Daily Archives: 2020年7月5日
学以致用大概就是这个意思
很早以前我在写 生信小技巧第8课,加上 TCGA的28篇教程- 批量下载TCGA所有数据,文末附上了当时看到的一个好玩的算法题目: Continue reading
学徒作业-根据我的甲基化视频教程来完成2015-NPC-methy-GSE52068研究
文章数据分析流程图如下: Continue reading
学徒作业-单基因的tcga数据挖掘分析
TCGA数据库关于食管癌的,分成ESCC和EAC,其中ESCC好发于中国人群,所以作者关心TCGA数据库里面的90个ESCC病人。
根据CCL2基因的表达量,可以把TCGA数据库里面的90个ESCC病人分成高低表达CCL2的两个组,然后可以差异分析,GSEA分析等等 Continue reading
信息熵的4个量化指标的R代码实现
熵(entropy)在统计学中是一个很重要的概念,代表着信息的多少。经济学里面衡量贫富差距的基尼系数,以及环境生物学领域衡量物种多样性的辛普森多样性指数,以及免疫组库领域的D50都有异曲同工之妙。 Continue reading
嫌弃cosmic数据库的30个肿瘤突变signatures?
肿瘤基因测序后,通常会得到一定数量的基因突变位点信息,somatic突变在全基因组上发生的比例约百万分之一,如果是全基因组肿瘤基因测序, 可能会有3万个左右的somatic突变,如果是全外显子测序,是300个左右,如果是捕获基因测序,那么取决于基因是否是热点突变。 Continue reading
为什么同样的人类病人遗传隐私保护政策各个科学研究团队遵守情况不一样
最近接触的单细胞文献比较多,发现不同文章的测序数据公布的地方很不一样,有的不让下载,有的是需要授权审核才能下载,有的是完全公开下载。很有意思,分享一下: Continue reading
是否是免疫细胞很容易区分那是否是肿瘤细胞呢?
单细胞转录组的火爆大家是有目共睹的,主要是在各式各样的物种器官图谱研究以及发育,肿瘤免疫研究。其中在肿瘤免疫一个很重要的分析点就是区分免疫细胞和非免疫细胞,这个还算是比较容易,比如文献《Zilionis et al., 2019, Immunity 》就提到: Continue reading
使用R包SomaticSignatures进行denovo的signature推断
前面我在生信菜鸟团的肿瘤外显子数据分析专辑提到了,很多研究者会嫌弃cosmic数据库的30个肿瘤突变signatures,他们觉得cosmic数据库30个signature的生物学意义并不好,自己会尝试分解出来自己的signature。比如:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》 这篇文献,研究者就是使用R包SomaticSignatures进行denovo的signature推断,拿到了11个自定义的signature。 Continue reading
使用R包deconstructSigs根据已知的signature进行比例推断
首先,自己推断denovo的signature,可以使用SomaticSignatures 包的identifySignatures函数,这个教程我在生信技能树分享过:使用R包SomaticSignatures进行denovo的signature推断,比如:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》 这个文献,研究者就是使用R包SomaticSignatures进行denovo的signature推断,拿到了11个自定义的signature。 Continue reading
使用NMF代替层次聚类
前面我们在教程:使用R包deconstructSigs根据已知的signature进行比例推断,顺利的把508个病人,根据11个signature进行了比例推断,得到的比例矩阵以普通的热图,以及pheatmap包自带的层次聚类如下: Continue reading
使用MiXCR进行免疫组库分析
前面我带领大家通过IMGT数据库认知免疫组库,而且也一起从IMGT数据库下载免疫组库相关fasta序列,免疫组库重要的研究对象就是分成BCR的IGH,IGK,IGL这3类,以及TCR的TRA,TRB,TRD,TRG,它们各自都有V,D(可选),J,C基因。 Continue reading
使用IMonitor进行免疫组库分析
其实前面我们已经分享了MiXCR,还有igblast,这两个免疫组库上游分析软件已经够用,如下: Continue reading
使用igblast进行免疫组库分析
前面我带领大家通过IMGT数据库认知免疫组库,而且也一起从IMGT数据库下载免疫组库相关fasta序列,免疫组库重要的研究对象就是分成BCR的IGH,IGK,IGL这3类,以及TCR的TRA,TRB,TRD,TRG,它们各自都有V,D(可选),J,C基因。 Continue reading