前面我们已经成功完成了《CNS图表复现专辑》的前20个关键图表的复现,现在开启第二波图表复现,会大量触及到补充图表。 目录及前面的代码总结 CNS图表复现专辑第二波开启 。 Continue reading
标准的单细胞转录组数据分析全部图表复现都在代码海洋
去年我们介绍过codeocean ,算是生物信息学数据分析者的一个福音,因为大量的好文章都是把绘图数据及代码一股脑的打包上去了,关键是都是可以重复出来的! Continue reading
多个物种的肾脏部位巨噬细胞比较
最近在单细胞天地公众号看到了:多个组织的成纤维细胞图谱 的介绍,挺有意思的, 这样的思路完全可以任意扩展开来啊,多个组织的多种细胞亚群都是可以比较,甚至迁移到多个物种啊,如果多物种的单细胞数据集存在的话! Continue reading
各种癌症都有自己的细分亚型
精准医疗时代,对于癌症我们最重要的就是分而治之,理论上应该是每个人的癌症都不一样,但实际上的医疗现实不允许我们对每个癌症患者都进行事无巨细的科研探索来给他制定个性化诊疗方案。能把以前大家混完一谈的单一器官癌症区分成为不同细分癌症,就已经是科研界近几十年的成果了。 Continue reading
构建驴转录组数据分析流程
最近安排实习生在整理转录组相关知识点,他也有自己的公众号,有一个保研专栏,感兴趣可以去看看! Continue reading
过表达一个基因和敲除它的作用一定是相反的吗?
对指定基因进行干扰,然后看它造成的全局转录水平的影响已经成为了探索该基因功能的主流思路。这也就是为什么转录组测序技术成为了大众首选,一个最简单的项目只需要2个分组合起来6个样品即可,算起来不到5000块钱人民币,如果分析的好就是一个独立的课题! Continue reading
基因别名的规范化
突然间发现大名鼎鼎的R包limma居然有一个函数是alias2Symbol,我看了看它的描述,其功能是Convert Gene Aliases to Official Gene Symbols Continue reading
多个10x单细胞转录组每个样品的3个文件如何归纳到同一个文件夹里面
我们以PNAS杂志的一个关于AD的单细胞的数据集, https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE157827 为例子,它有 21个10x样品哦,总计是 169,496 nuclei 单细胞,大家可以去下载它的文件:会得到如下所示: Continue reading
不同单细胞亚群差异分析做什么火山图
不止一个人问我,他单细胞差异分析的结果,因为p值过于显著,无限接近于0,导致火山图展现非常诡异!
2个分组的单细胞项目标准分析
绝大部分还没有接触单细胞的小伙伴很容易被无良自媒体带节奏,误以为单细胞就等价于CNS级别文章,或者再差也是子刊级别。实际上新技术的红利窗口期非常短暂,从样品量数据量的要求一直在水涨船高!比如我们看看某公司2020第四季度单细胞文章合辑,如下所示: Continue reading
课程推荐-刘小乐教授-计算生物学与生物信息学课程
前面我们在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,然后在生信菜鸟团分享了:中国大学MOOC的生物信息学之华中农业大学。 Continue reading
最开始使用harmony等算法去除样品差异为什么效果会这么差
昨天我们分享了:《 细胞亚群细分的时候仍然是要选择harmony等算法去除样品差异 》,有粉丝留言提到这个使用harmony等算法去除样品差异,不应该是最开始就弄吗。为什么要到细分亚群的时候才做呢? Continue reading
FindMarkers做差异分析默认就不会返回全部基因
我们正常单细胞表达量矩阵,是有2万个基因。但是通常情况下我们走单细胞流程,会仅仅是挑选2000个高变基因做后续分析,所以FindMarkers函数默认就是针对这2000个基因在做分析。 Continue reading
LncRNA鉴定上游分析
前面我们介绍了一系列的LncRNA鉴定相关文献的案例精选:
pipeline for lincRNA Identification
前面我们跑完了hisat2和stringtie流程,拿到了组装好的gtf文件。详见:LncRNA鉴定上游分析 Continue reading
ngs组学数据分析上下游之分
前些日子我们《生信技能树》的工程师做了一个ATAC-seq的项目,给客户汇报结果的时候,照例提供了全套代码。不过这次是从fq文件开始,所以大量代码都是在Linux平台的命令行而已,虽然给了客户全部的代码,但是客户直接说不想学,问有没有基于R的实现方式。 Continue reading
R语言也有自己的期刊杂志哦
看到vip交流群有人询问根据基因名称,批量下载碱基序列的方法,其实就是一个R包《rentrez: An R package for the NCBI eUtils API》 Continue reading
scRNAseq包整理好的单细胞数据集你都处理了一遍吗?
我们以前就提到过:很多出名的单细胞数据集,比如Pollen et al. 2014 数据集,本质上属于地址为https://hemberg-lab.github.io/scRNA.seq.datasets/human/tissues/ ,的宝藏网页。 Continue reading
suppa的diffsplice太慢了
我们发布了转录组产品线的一些服务,连接生信技能树粉丝群体的数据分析工程师和有数据分析的科研人员: Continue reading
tcga等公共数据库查询你的基因没有统计学显著的预后作用你就放弃了吗
看到了发表于2021年4月在NC期刊的文章,标题是:《DUSP16 promotes cancer chemoresistance through regulation of mitochondria-mediated cell death》,链接是:https://www.nature.com/articles/s41467-021-22638-7 Continue reading