我们的CNS图表复现之旅已经开始,前面3讲是;
如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。
眼尖的同学发现,我的代码里面,关于单细胞聚类分群的resolution参数一直在变化:
sce <- FindNeighbors(sce, dims = 1:15)
sce <- FindClusters(sce, resolution = 0.2)
table(sce@meta.data$RNA_snn_res.0.2)
sce <- FindClusters(sce, resolution = 0.8)
table(sce@meta.data$RNA_snn_res.0.8)
sce <- FindClusters(sce, resolution = 0.5)
table(sce@meta.data$RNA_snn_res.0.5)
然后提出疑问,这个resolution参数到底应该是选择多少呢?难道这个步骤没有一个绝对的标准吗?
我之前给大家举例是使用balloonplot这个可视化函数,代码如下:
library(gplots)
tab.1=table(sce@meta.data$RNA_snn_res.0.2,sce@meta.data$RNA_snn_res.0.8)
balloonplot(tab.1)
就可以很直观的看到,我们把resolution参数分别赋值为0.2和0.8的效果,如下:
很明显,这个resolution越小呢,我们得到的分群数量就越少,所以0.2的时候是17个群,但是0.8的时候是31个群。
而且我们根据balloonplot的可视化,可以看到,在0.2的时候的17个群里面的有一些群,会随着resolution的调高,继续裂变成为多个群。
有意思的是,我恰好在你要的rmarkdown文献图表复现全套代码来了(单细胞) 看到了一个更好的可视化方法:
# Check clustering stability at given resolution
# Set different resolutions
res.used <- seq(0.1,1,by=0.2)
res.used
# Loop over and perform clustering of different resolutions
for(i in res.used){
sce <- FindClusters(object = sce, verbose = T, resolution = res.used)
}
# Make plot
library(clustree)
clus.tree.out <- clustree(sce) +
theme(legend.position = "bottom") +
scale_color_brewer(palette = "Set1") +
scale_edge_color_continuous(low = "grey80", high = "red")
clus.tree.out
就是借用clustree包,可视化如下:
可以非常清晰的看到,随着resolution的调高,具体是哪些群在不停地继续裂变成为多个群。
但是呢, 仍然是没有回答粉丝的问题,就是resolution设置多少,难道说没有一个绝对的指标吗?
我这里只能说,确实没有,不仅仅是resolution参数,生物信息学数据分析过程中,就比如这个单细胞吧,质控的时候去除多少个质量差的细胞去除多少基因,选择高变基因数量多少,PCA降维后选择多少个PC,基本上每个步骤都是可以灵活调整的。
这就是,数据分析的魅力吧。
交流群里大家讨论的热火朝天,而且也都开始了图表复现之旅,在这里我还是带大家一步步学习CNS图表吧。如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。
文末友情推荐
要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160 。
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班:
- 数据挖掘学习班第7期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。
- 生信爆款入门-第9期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。
如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?
号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!另外,:绝大部分生信技能树粉丝都没有机会加我微信,已经多次满了5000好友,所以我开通了一个微信好友,前100名添加我,仅需150元即可,3折优惠期机会不容错过哈。我的微信小号二维码在:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》