最近连续看到了两个单基因研究文章,它们的落脚点都是敲减过表达具体的某个基因看它的效果。但是我仔细看了文章里面提到的基因名字,和其上传到geo数据库的居然是不一致的! Continue reading
找到的peaks需要过滤掉ENCODE的黑名单区域
表观组学流程,主要看到就是分析拿到peaks区域,包括ChIP-seq,ATAC-seq,甚至单细胞的ATAC-seq。 Continue reading
这个10x单细胞转录组样品数据分析挂在预印本三年了
看到了一个预印本研究成果,标题很霸气:《Cell atlas of human uterus》,Posted February 19, 2018. 链接是https://www.biorxiv.org/content/10.1101/267849v1 Continue reading
这个文件大到R语言已经无能为力
最近在这里 COVID19 相关单细胞文献的数据集,看到了一个迄今为止数据量最大的。题为“COVID-19 immune features revealed by a large-scale single cell transcriptome atlas”的研究性论文,通过对196例新冠肺炎病人284个样本进行单细胞转录组测序,绘制了新冠肺炎病人的 Continue reading
这算是不一样吗?
在《单细胞天地》的交流群,看到有粉丝提问关于 FindMarkers与AverageExpression 两个函数的差异 : Continue reading
使用基于python的velocyto软件做RNA速率分析
单细胞领域的一个高级分析是RNA速率分析,使用velocyto软件可以做,我们同样的把它区分为上下游分析。 Continue reading
使用pyscenic做转录因子分析
前面我们已经是完整的展示了使用R语言的scenic做转录因子分析的流程,但是在公开课演示100个细胞走这个流程,发现居然是耗时20min,实在是不能忍。哪怕是再不喜欢python,也得学一学pyscenic了! Continue reading
使用R语言做机器学习的书籍推荐
总是有一些小伙伴觉得机器学习很高大上,令人望而生畏,其实它就是我们常见的统计学方法,比如做表达量矩阵分析,通常是需要绘制pca图看看组间差异是否足够明显。 Continue reading
使用SingleR构建自定义细胞亚群数据库
前面的教程:[混合到同一个10X样品里面的多个细胞系如何注释](https://mp.weixin.qq.com/s/S5TJ2JDOYAOynhjXwTH-FQ),我们提到了可以使用细胞系的表达量矩阵去跟细胞亚群表达量矩阵进行相关性计算,然后就可以判断细胞亚群的生物学意义啦。当然了,我们也给出来了一个比较不错的可视化方法,见:[如果你觉得相关性热图不好看,或者太简陋](https://mp.weixin.qq.com/s/jrV5HER_bmWyvXGzi608Tw)。 Continue reading
使用wget批量下载geo数据集的全部文件
单细胞转录组教程我们写的差不多了,是时候进军单细胞ATAC和空间单细胞了,找到了这个经典的 《单细胞ATAC》数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE129785 ,对应的文章是:Massively parallel single-cell chromatin landscapes of human immune cell development and intratumoral T cell exhaustion. Nat Biotechnol 2019 Aug;37(8):925-936. PMID: 31375813
曾经我给你带来了十万用户,但现在祝你倒闭
参加过我们《生信技能树》的各个知识整理和分享活动的单细胞应该是都知道,我们比较推崇一个叫做简书的平台,因为它可以书写markdown语法。 Continue reading
特定mRNA基因的相关性lncRNA计算
这个策略目前应用蛮广泛的, 比如文章《A Novel Inflammatory lncRNAs Prognostic Signature for Predicting the Prognosis of Low-Grade Glioma Patients》就是提取TCGA和CGGA共有的炎症基因mRNA和lncRNA的表达数据后,采用Pearson法分析lncRNA与LGGs炎症相关基因的相关性,相关系数为| r| > 0.7的lncRNA视为炎症相关lncRNA。当然了,也可以提取免疫相关mRNA基因,自噬的,细胞焦亡的,缺氧的。 Continue reading
仅仅是改变了统计学显著性呢?还是说改变了其本性
前面我们分享过:学徒数据挖掘之谁说生存分析一定要按照表达量中位值或者平均值分组呢?,可以很容易对一个基因,根据表达量分组,然后进行生存分析,判断它是风险因子或者是保护因子,当然了前提是具有统计学显著性啦。 Continue reading
我以为我画错了
最近安排团队一起学习肿瘤外显子流程,处理的数据来源于2017年CELL杂志的文章《Tumor and Microenvironment Evolution during Immunotherapy with Nivolumab》,跑完上游流程拿到了maf格式的肿瘤特异性的somatic突变位点后,第一张图就应该是突变全景图,所以有如下代码: Continue reading
细胞亚群细分的时候仍然是要选择harmony等算法去除样品差异
我们做肿瘤研究的单细胞数据,一般来说会选择初步很粗狂的定义大的细胞亚群,比如我常用的 第一次分群是通用规则是: Continue reading
细分亚群后需要使用harmony去除样品差异
经过了大量的单细胞转录组数据分析基础讲解,相信大家对第一层次降维聚类分群都不陌生了。参考我们的《明码标价》专栏里面的单细胞内容 Continue reading
现代生物学所需要的现代统计学
看到了一本有意思的书籍:《现代生物学所需要的现代统计学》,名字是我自己翻译的。
主要是因为太多小伙伴在咱们《生信技能树》后台咨询过想不错生物学知识和统计学知识,恰好这个《Modern Statistics for Modern Biology》把二者涵盖了,在线阅读链接:https://www.huber.embl.de/msmb/index.html Continue reading
单细胞文献你不整理后面肯定甚至会忘记自己曾经读过
我们的《单细胞文献100》活动激起了大家对单细胞的兴趣, 马上交流群有朋友咨询B细胞的细分亚群,希望给出参考文献,我恰好在看新冠病毒相关单细胞数据分析文章, 就给出来了这个:《Single-cell landscape of immunological responses in patients with COVID-19》 Continue reading
单细胞数据分析(全部一折)
不知道有多少朋友还记得我们两年前(2019年底)的单细胞数据分析报价:[单细胞转录组数据分析大放价 (疫情期间不打烊)] Continue reading
全新细胞系模型的提出也需要ngs数据支持
很多《生信技能树》的粉丝虽然一直在关注我们,但是他们总觉得我们这样的数据处理很遥远,感觉自己可能一辈子都不会接触ngs组学,纯粹的动物实验分子实验操作。 Continue reading