很早之前我们就总结过虽然虽然M1和M2的分类深入人心,但是在单细胞水平里面正确的做法可能是放弃M1和M2,详见:M1和M2的巨噬细胞差异就在CD86和CD163吗,很多单细胞文章都表明了巨噬细胞的M1和M2极化相关基因在单细胞水平是正相关,比如:
- https://www.sciencedirect.com/science/article/pii/S0092867418307232
- https://www.biorxiv.org/content/10.1101/566968v1.full
再比如2022发表在 Genome Biology 的文章:《Decoding the multicellular ecosystem
of vena caval tumor thrombus in clear cell renal cell carcinoma by single‐cell RNA sequencing》就是以降维聚类分群为主,纯粹的数字编号即可 :
在降维聚类分群后的umap图里面,M1和M2它们的界限并不是很清晰,而且在气泡图里面CD86和CD163的表达量也不是说在CD86和CD163里面互斥,仅仅是表达量的些微高低而已。能泾渭分明的巨噬细胞分类
2022的一篇CELL文章:《Tissue-resident FOLR2+ macrophages associate with CD8+ T cell infiltration in human breast cancer》就提到了里面的巨噬细胞可以分类成为2个:
- (1) TREM2+ macrophages expressing triggering receptor expressed by myeloid cells-2 (TREM2) and osteopontin (SPP1) genes,
- (2) FOLR2+ macrophages expressing folate receptor 2 (FOLR2), hyaluronan recep- tor (LYVE-1), and mannose receptor C-Type 1 (MRC1/CD206) genes.
虽然说代码层面的降维聚类分群肯定是不稳定的,不同的参数决定了可以区分成为多少个亚群,但是人类的归纳法可以隐隐约约看到了TREM2和FOLR2基因的排他性:
生命科学领域倾向于采用二分类定义(如抗癌 vs. 促进癌症、抗炎症 vs. 促进炎症)的原因有多个,这反映了研究的实际需要和方法的便利性:
- 简化复杂性:生命科学中的生物过程通常非常复杂,包括多个分子、细胞和组织的相互作用。将这些复杂性归纳为两个明确的类别可以简化问题,使其更容易理解和研究。
- 实验设计和统计分析:在实验设计和统计分析中,二分类问题更容易处理。它们使得使用常见的统计方法,如T检验、卡方检验和逻辑回归等,更加方便。这些方法可以用来检验两组之间是否存在显著差异。
- 临床和应用需求:在医学和临床领域,二分类定义通常用于诊断、治疗决策和疾病风险评估。例如,将患者分为“健康”和“患病”两类,有助于医生更容易理解和管理患者的情况。
- 教育和科普:将复杂的概念简化为二分类问题对于教育和科普也很有帮助。它们更容易向学生和公众传达,促使更广泛的人理解和参与。
另外一个2020的CELL文章里面也是如此,详见:《Onco-fetal Reprogramming of Endothelial Cells Drives Immunosuppressive Macrophages in Hepatocellular Carcinoma》,可以看到也是多个巨噬细胞,但是主要是TREM2联合SPP1,去和FOLR2基因的排他性,这样的二分类模式。
还有一个新鲜出炉(2023年8月)的science杂志文章:《CXCL9:SPP1 macrophage polarity identifies a network of cellular programs that control human cancers》,提出来的是CXCL9 and SPP1 (CS) expression but not by conventional M1 and M2 markers,而且是公布了数据:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE234933GSE234933_MGH_HNSCC_cell_annotation.txt.gz 1.4 Mb GSE234933_MGH_HNSCC_gex_raw_counts.tar.gz 1.0 Gb GSE234933_MGH_HNSCC_sample_annotation.txt.gz 680 b
学徒作业
对上面的GSE234933数据集,进行降维聚类分群,通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45+,PTPRC),
- epithelial/cancer (EpCAM+,EPCAM),
- stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。
所以上面的GSE234933数据集,会得到大概如下所示的分群,巨噬细胞属于髓系免疫细胞:
然后提取里面的巨噬细胞,进行细致的分析,比如绘制 Scatter plot of CXCL9 and SPP1 expression in each of 16,292 macrophages
仔细看看这里的CXCL9 and SPP1的排他性,跟前面提到的TREM2联合SPP1,去和FOLR2基因的排他性,是不是一回事?
当然了,不一定要散点图去展示CXCL9 and SPP1的排他性,我们通常是 使用seurat标准流程即可的5个基础函数。详见以前我们做的投票:可视化单细胞亚群的标记基因的5个方法,下面的5个基础函数相信大家都是已经烂熟于心了: - VlnPlot(pbmc, features = c(“MS4A1”, “CD79A”))
- FeaturePlot(pbmc, features = c(“MS4A1”, “CD79A”))
- RidgePlot(pbmc, features = c(“MS4A1”, “CD79A”), ncol = 1)
- DotPlot(pbmc, features = unique(features)) + RotatedAxis()
- DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)