感兴趣成纤维细胞的非常多,可能主要是因为肿瘤领域的火爆,肿瘤微环境里面的免疫相关,不管是淋巴系还是髓系,都有了大量的 成果。反而是肿瘤微环境里面的基质细胞,比如内皮细胞,成纤维和周细胞目前还大有可为。
前面提到了:肿瘤样品的单细胞需要提取上皮细胞继续细分,就是感兴趣的fibroblasts等细胞亚群占比非常少,所以研究者们做了第二次单细胞转录组数据,见:什么,你想要的单细胞亚群比例太少了?,其实这样的策略屡见不鲜。在小鼠模型里面也有:4T1这个TNBC小鼠肿瘤模型的CAFs异质性,其实大家并不能很好的确定自己研究的对象就是成纤维细胞。比如这个 肿瘤相关成纤维细胞异质性 就是分成了6群:
- Subcluster 0 被作者定义为 vascular CAFs ,高表达 GJA4, and RGS5 等
- Subcluster 1 被作者定义为 matrix CAFs ,高表达 LUM, DCN, and VCAN等
- Subcluster 2 被作者定义为 inflammatory CAFs ,高表达 complement genes (C3 and C7). 等
- Subcluster 3 被作者定义为 antigen-presenting CAFs ,高表达CD74, HLA- DRA, and HLA-DRB1 等
- Subcluster 4 被作者定义为 EMT-like CAFs ,高表达 KRT19, KRT8 等
- Subcluster 5 被作者定义为 lip- ofibroblast–c5–FABP1 ,高表达APOA2, FABP1, FABP4, and FRZB等
如果按照其它理论,会认为所谓的 vascular CAFs ,高表达 GJA4, and RGS5 等,其实是周细胞,而 EMT-like CAFs ,高表达 KRT19, KRT8 ,可能都不一定是一个真正的单细胞亚群。
这个时候多看不同的文献,进行归纳汇总,应该是一个比较好的策略。
比如2022年发表在《Theranostics》杂志的文章:《Single-cell RNA landscape of the osteoimmunology microenvironment in periodontitis》 ,首先进行第一层次降维聚类分群,得到了如下所示的10个亚群 :
- (1) T cell cluster
- (2) B cell cluster
- (3) plasma cell cluster
- (4) endothelial cell cluster
- (5) neutrophil cell cluster
- (6) monocytic cell cluster
- (7) fibroblast cell cluster
- (8) mast cell cluster
- (9) epithelial cell cluster
- (10) myeloid-derived suppressor cell cluster (MDSC)
可以看到 这个时候的所谓的 fibroblast细胞亚群首先占比并不多,给出来的标记基因就一个 COL1A1:
所以接下来作者把这 2194个fibroblast细胞提取出来,再次进行降维聚类分群,发现里面其实并不都是成纤维细胞,如下所示 :
再次从里面拿到 1358 真正的 fibroblasts (cluster 1/2/3/5/8/9 in A), ,继续降维聚类分群,居然又是可以区分成为6个独立的亚群 :
值得注意的是其中有3个成纤维细胞亚群,给了全新的名字:
- CD55+ MSCs (sC 2),
- APOE+ pre-OBs (sC 3),
- IBSP+ OBs (sC4)
这个研究的重点就是关注这3个亚群,使用拟时序方法来看具体细节上的差异 :
是不是很有意思?
其实挺容易看懂的,如果你是现在才入坑单细胞的,可以先看看基础10讲:
- 01. 上游分析流程
- 02.课题多少个样品,测序数据量如何
- 03. 过滤不合格细胞和基因(数据质控很重要)
- 04. 过滤线粒体核糖体基因
- 05. 去除细胞效应和基因效应
- 06.单细胞转录组数据的降维聚类分群
- 07.单细胞转录组数据处理之细胞亚群注释
- 08.把拿到的亚群进行更细致的分群
- 09.单细胞转录组数据处理之细胞亚群比例比较
最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释