在单细胞大行其道的如今,也有不少课题组选择做cytof数据,全称是:Cytometry + Time Of Flight,是Fluidigm公司的产品,可以检测单个细胞的多个设定好的抗体的信号强度。这些抗 Continue reading
Monthly Archives: 9月 2021
estimate的两个打分值本质上就是两个基因集的ssGSEA分析
前面我们针对TCGA数据库全部的癌症的表达量矩阵批量运行 estimate,而且得到了estimate的两个打分值,可以发现可以看到不同癌症内部的estimate的两个打分值是有异质性的。
featureCounts和DEXseq做基于外显子定量的可变剪切
前面我们在《生信技能树》已经是多次分享了变剪切相关教程: Continue reading
药物处理前后筛选靶基因
我们在前面的 明码标价之公共数据库探索 提到了文章作者比较了TCGA数据库的ESCC的N0和N3时期的肿瘤样品表达量样品的差异,从而开启一个科研项目,让大家误会了,以为那个文章就这么简单。 Continue reading
一个10X样品测8个细胞系
我们七月份的学徒培养专注于单细胞数据处理,第一个学徒选择的文章很有意思,标题是:《Single-cell transcriptomic heterogeneity in invasive ductal and lobular breast cancer cells》 Continue reading
一个基因可以在不同癌症分别发挥抑癌和促癌作用
看到了一个综述,标题是 :《ID4 controls luminal lineage commitment in normal mammary epithelium and inhibits BRCA1 function in basal-like breast cancer》,提到了: Inhibitor of differentiation (ID) 基因家族的ID4这个基因的两面性,如下所示: Continue reading
一个农学生的“自我救赎”
1 选择
各位好,我叫小汪,一个来自湖北,现就读于华中农业大学的准大四学生。 Continue reading
一模一样又有何难
昨天我们给《单细胞天地》的交流群的粉丝提问,关于 FindMarkers与AverageExpression 两个函数的差异,做出来一个简单的示意图解释,见:[这算是不一样吗] Continue reading
有了风险因子森林图为什么还需要列线图
今天这个推文甚至算不上一个教程,但是里面的代码其实是复制粘贴就可以运行哦。之所以写它,主要是是因为交流群有粉丝总是问各种各样的代码问题,风险因子森林图啊列线图的,归根到底就是R基础知识不牢固,所以报错连连。 Continue reading
有些批次效应是不可能被矫正的
又一次被迫讨论这个让人又爱又恨的批次效应了,主要是因为上一个教程 不同癌症的差异难道大于其与正常对照差异吗:大家的留言: Continue reading
愿所有的基因都有一个正式的名字
最近连续看到了两个单基因研究文章,它们的落脚点都是敲减过表达具体的某个基因看它的效果。但是我仔细看了文章里面提到的基因名字,和其上传到geo数据库的居然是不一致的! Continue reading
找到的peaks需要过滤掉ENCODE的黑名单区域
表观组学流程,主要看到就是分析拿到peaks区域,包括ChIP-seq,ATAC-seq,甚至单细胞的ATAC-seq。 Continue reading
这个10x单细胞转录组样品数据分析挂在预印本三年了
看到了一个预印本研究成果,标题很霸气:《Cell atlas of human uterus》,Posted February 19, 2018. 链接是https://www.biorxiv.org/content/10.1101/267849v1 Continue reading
这个文件大到R语言已经无能为力
最近在这里 COVID19 相关单细胞文献的数据集,看到了一个迄今为止数据量最大的。题为“COVID-19 immune features revealed by a large-scale single cell transcriptome atlas”的研究性论文,通过对196例新冠肺炎病人284个样本进行单细胞转录组测序,绘制了新冠肺炎病人的 Continue reading
这算是不一样吗?
在《单细胞天地》的交流群,看到有粉丝提问关于 FindMarkers与AverageExpression 两个函数的差异 : Continue reading
使用基于python的velocyto软件做RNA速率分析
单细胞领域的一个高级分析是RNA速率分析,使用velocyto软件可以做,我们同样的把它区分为上下游分析。 Continue reading
使用pyscenic做转录因子分析
前面我们已经是完整的展示了使用R语言的scenic做转录因子分析的流程,但是在公开课演示100个细胞走这个流程,发现居然是耗时20min,实在是不能忍。哪怕是再不喜欢python,也得学一学pyscenic了! Continue reading
使用R语言做机器学习的书籍推荐
总是有一些小伙伴觉得机器学习很高大上,令人望而生畏,其实它就是我们常见的统计学方法,比如做表达量矩阵分析,通常是需要绘制pca图看看组间差异是否足够明显。 Continue reading
使用SingleR构建自定义细胞亚群数据库
前面的教程:[混合到同一个10X样品里面的多个细胞系如何注释](https://mp.weixin.qq.com/s/S5TJ2JDOYAOynhjXwTH-FQ),我们提到了可以使用细胞系的表达量矩阵去跟细胞亚群表达量矩阵进行相关性计算,然后就可以判断细胞亚群的生物学意义啦。当然了,我们也给出来了一个比较不错的可视化方法,见:[如果你觉得相关性热图不好看,或者太简陋](https://mp.weixin.qq.com/s/jrV5HER_bmWyvXGzi608Tw)。 Continue reading
使用wget批量下载geo数据集的全部文件
单细胞转录组教程我们写的差不多了,是时候进军单细胞ATAC和空间单细胞了,找到了这个经典的 《单细胞ATAC》数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE129785 ,对应的文章是:Massively parallel single-cell chromatin landscapes of human immune cell development and intratumoral T cell exhaustion. Nat Biotechnol 2019 Aug;37(8):925-936. PMID: 31375813