singleR是目前单细胞转录组领域算是比较出众的自动化细胞类型注释系统,所以我分享的两个祖传代码里面都加上了它,成为标准流程:
singleR自带7个数据库文件,需要联网才能下载,其中5个是人类数据,2个是小鼠的数据:
- BlueprintEncodeData Labels
- HumanPrimaryCellAtlasData Labels
- DatabaseImmuneCellExpressionData Labels
- NovershternHematopoieticData Labels
- MonacoImmuneData Labels
- ImmGenData Labels
- MouseRNAseqData Labels
联网下载不同数据库文件的代码是:
library(SingleR)
cg=BlueprintEncodeData()
cg=DatabaseImmuneCellExpressionData()
cg=NovershternHematopoieticData()
cg=MonacoImmuneData()
cg=ImmGenData()
cg=MouseRNAseqData()
cg=HumanPrimaryCellAtlasData()
就会有一个问题,中国大陆地区的部分网络其实是没办法联通singleR数据库中心,所以文件是下载失败的。收到很多粉丝求助,所以我就简单检查了一下singleR的下载数据库文件联网机制:
查看snapshotDate()函数,发现它属于AnnotationHub 包,再次查看相关函数,发现了它存放数据库文件的地址, 如下:
可以看到,其函数下载的数据库文件,都在这里,其实找一下8月30号的文件即可,但是我嫌弃它麻烦,就全部打包啦。上传到百度云:
链接:https://pan.baidu.com/s/1y4uJOmOjLe-vrNfw0fSi1w
提取码:tree
如果是Windows用户的话,解压后,放在指定路径的文件夹即可
C:\Users\win10\AppData\Local\ExperimentHub\ExperimentHub
# 其中 win10 需要替换成为你自己的用户名哦
然后你再次运行:
library(SingleR)
hpca.se <- HumanPrimaryCellAtlasData()
hpca.se
就会发现你已经跨越了网路障碍,可以使用singleR的各个数据库文件啦。
后来在群里大家交流的时候,发现一个更好大家解决方案,来自于我们一直强推的《生信会客厅》
他上传的就不是我前面的数据库文件,所以也就无需找到文件夹去替换文件。你使用他的百度云,可以拿到后缀名是RData的文件,使用方法如下:
refdata <- get(load("ref_Monaco_114s.RData"))
sce_for_SingleR <- GetAssayData(sce, slot="data")
clusters <- sce@meta.data$seurat_clusters
pred.hesc <- SingleR(test = sce_for_SingleR, ref = refdata,
labels = refdata$label.fine,
#因为样本主要为免疫细胞(而不是全部细胞),因此设置为label.fine
method = "cluster", clusters = clusters,
#这里我们为上一步分的9个cluster注释celltype
assay.type.test = "logcounts", assay.type.ref = "logcounts")
table(pred.hesc$labels)
云盘链接是:
链接:https://pan.baidu.com/s/13EjK-66tZKRsSl9G80S7uw
提取码:8mfb
文件如下:
文末友情推荐
要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160 。
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班:
- 数据挖掘学习班第7期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。
- 生信爆款入门-第9期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。
如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?
号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!另外,:绝大部分生信技能树粉丝都没有机会加我微信,已经多次满了5000好友,所以我开通了一个微信好友,前100名添加我,仅需150元即可,3折优惠期机会不容错过哈。我的微信小号二维码在:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》