前些天在我们生信技能树视频号直播一个文章的单细胞转录组数据(GSE208706)处理,文章是:《Amphiregulin from regulatory T cells promotes liver fibrosis and insulin resistance in non-alcoholic steatohepatitis》,就是基本的降维聚类分群而已,几分钟就搞定了。
一般来说,麻烦的地方都是单细胞亚群的生物学命名啦,如下所示可以看到我在我们生信技能树视频号直播时候就是简单的分了大类,这个也是我常规的操作,代码在:(链接: https://pan.baidu.com/s/1pKEnPmWXi-pTab0WZUWzgg?pwd=a7s1) ,这样的话,很多看直播的小伙伴们就“如临大敌”,觉得做错了,很明显文章里面的给出来了两个不一样的髓系免疫细胞,但是我统一操作成为了巨噬细胞。就算是髓系免疫细胞包括巨噬细胞,我演示的巨噬细胞少了一个亚群呀:
这个时候就回答了大家关心的另外一个话题了,降维聚类分群的时候设置的分辨率这个参数不高!其实你提高分辨率就可以继续细分,如下所示可以看到里面是有多个亚群的(编号4和编号8,13,17 ):
再认真看细分之后的各个亚群的特异性高表达量基因,就可以看到了文章里面的Trem2特异性亚群就是上面的编号8的亚群 ,而编号4是另外一个特异性基因比如 Chil3特异性巨噬细胞 :
另外,值得注意的基因表达量高低分群,靠的是相对高低,而且绝对的表达量的有无!上面提到的Trem2基因表达量并不是说仅仅是在Trem2特异性亚群表达,而且因为它表达量要高于其它亚群,这就是为什么作者会把编号4的巨噬细胞亚群和编号8,13,17的亚群分开,这样的话,虽然说无限制提供分辨率确实是可以得到无限制多数量的单细胞亚群,但是通常情况下是生物学意义很难说清楚。
而且也并不是说巨噬细胞就两个亚群,我们之前就分享过:【巨噬细胞新分类体系(放弃传统M1和M2)】,一切都是数据结果合理的挑选和解释而已。
另外,我们通常是并不会选择提高分辨率这个手段来获取精细的单细胞亚群,而是取巨噬细胞子集后,继续进行降维聚类分群后再命名的策略。参考:取单细胞亚群子集细分的时候一定会出现干扰亚群(所以不要惊慌),,这样的话你就可以看到细胞亚群里面的混杂因素,而且可以手动删除到干扰因素。