27

比较两种不同算法的表达量矩阵的差异分析结果

前面我们视频号直播了一个表达量芯片数据处理,详见:这样去除表达量芯片的批次效应可能不妥,这个物信息学数据挖掘的标题是:《Novel ferroptosis gene biomarkers and immune infiltration profiles in diabetic kidney disease via bioinformatics》,直播回放的视频在:

我们分享了一个案例,就是GSE30122这个数据集的作者给出来的表达量矩阵是被zscore的,所以我们可以下载它的cel文件自己制作表达量矩阵,详见: Continue reading

27

SCTransform真的能完美替代Seurat早期的3个函数吗

在Seurat的官网可以看到SCTransform关于的描述,是:Note that this single command replaces NormalizeData(), ScaleData(), and FindVariableFeatures()

但是因为我接触单细胞有点早,是2017附近,那个时候经历了Seurat的v2变成v3的大更新,跟现在的小伙伴们经历了v4变成v5是一样的困扰,所以其实我从来就没有在我的代码里面做SCTransform,因为早期的 NormalizeData(), ScaleData(), FindVariableFeatures()三个函数,使用的也挺好的。但是最近学徒表示他发现了这里面的细节差异而且百思不得其解,所以我归纳汇总了一些学徒的探索,让大家一起看看是咋回事! Continue reading

27

monocle2拟时序实战细节剖析

前面我们提到了目前绝大部分单细胞转录组数据分析相关文章都不约而同的使用了monocle2这个软件来做拟时序分析,但是并不意味着它是金标准,也不意味着非monocle2不可。

这个纯粹就是生物信息学领域的“马太效应”,大家都用monocle2做拟时序,所以后来者就简单的追随即可,而且绝大部分人其实并不关心算法细节,仅仅是为了做拟时序而做,那么就无所谓选择哪个软件了。我们也简单的展示了目前的可以做拟时序分析的软件的测评,详见:拟时序的多种算法大比拼(拟时序一本通03) 。但是,测评归测评,最终大家还是得使用monocle2做拟时序分析,所以不得不把重点放它的细节剖析上面,我们后面也会介绍一下其它软件和方法: Continue reading

27

find加上exec的参数来批量修改文件名字

需求:一个单细胞转录组项目文件夹里面的每个样品都是独立的文件夹,而且每个文件夹里面的都有一个genes.tsv.gz 文件,是需要修改为 features.tsv.gz 文件名字的!

10x的文件格式

目前10x的单细胞转录组技术给出来的表达量矩阵,主要是Market Exchange Format (MEX)格式,每个样品都会有一个filtered_feature_bc_matrix文件夹,里面会有3个文件,如下所示: Continue reading

27

bioconductor有新的镜像选择啦

我的电脑里面有一千多个生物信息学多组学数据处理相关的r包,最近三五年基本上没有怎么安装过新的包,但是最近在一个新电脑里面进行视频号直播的时候发现下面的代码读取cel文件格式的affymetrix表达量芯片的时候其实是会自动安装一个包: Continue reading

07

9个小鼠分成3组后取36个样品做转录组测序可以做多少组合的差异分析

转录组测序后差异分析大家应该是都不陌生了,现在的生命科学领域的研究如果不加入一个转录组都会让人很奇怪,慢慢的它的地位开始赶上传统的PCR(聚合酶链反应)或者Western Blot(WB,蛋白质印迹)等技术。
如果一个转录组测序项目只有两个分组,那么简单的单次差异分析即可。但是如果有3分组就麻烦了,简单的理解就是两个处理组去和一个对照组差异,然后这两次差异分析的结果可以去对比一下,比如取交集。如下所示的案例: Continue reading