隔三差五就有小伙伴在交流群里面问到他自己在进行CD4和CD8的T细胞细分亚群的时候非常纠结,根本就没办法确定下来到底应该是分多少群以及到底是应该按照什么顺序分。其实很正常,之前我们组建了CD4和CD8的T细胞的交流群就探讨失败,虽然说CD8 T和CD4 T细胞亚群 是一种分类方法,但是各自内部又是可以按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion。
比如2022的nature文章:《Androgen receptor activity in T cells limits checkpoint blockade efficacy》,该研究的单细胞数据集里面总共是1.6万个单细胞,然后是提取里面的T细胞后仍然还有1.2万。而且可以看到,对单独的T细胞进行常规的降维聚类分群后,这个时候的分群数量完全是取决于代码的参数而已,尤其是取决于分辨率。所以是亚群的数量既然是可以调节的,就无所谓金标准了。
数量首先没有金标准,其次分群后这些亚群的生物学名字就更加没有标准了,比如上面的CD4里面就有比较经典的naive,helper和treg,而且CD8就有点难搞,同时也需要添加一些top基因在上面进行标识:
而且各个单细胞亚群的top特异性高表达基因也不会跟第一层次那样的泾渭分明。通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是:
- immune (CD45+,PTPRC),
- epithelial/cancer (EpCAM+,EPCAM),
- stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。分享一些用得着的CD4和CD8的T细胞的基因吧
比如按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion:
- naive (LEF1, SELL, TCF7),
- effector (IFNG),
- cytotoxicity (GZMB, PRF1),
- early and general exhaustion (PDCD1, CTLA4, ENTPD1 ) .
- antigen presentation (CD74, HLA-DRB1/5, HLA-DQA2)
如果你使用上面的基因列表,你会发现主要的naive状态的是CD4的T细胞,其它主要是CD8的T细胞。
然后是: - naive T cell, such as CCR7, LTB, and SELL
- memory CD4+ T cells (TEM) CXCR4, TNFRSF4, and CCR6, RORA, IL6ST, and IL17RA, suggesting a TH17 cell identity
- cytotoxicity associated genes (GZMH, GZMA, and GZMB) were expressed in cluster T4
- T cell receptor alpha and beta chain variable genes with TRAV13-2 and TRBV7-9 were enriched in cluster T5
- Cluster T6 was characterized as naive CD8+ T cells with the high expression of CCR7, LEF1, and CD27.
更多的时候其实是打分,并不能完全是看某个基因或者某些基因在某个单细胞亚群里面的排他性的特异性高表达,比如 resident, cytotoxic, exhausted, and costimulatory score for CD8 T cells. - 5 resident markers (RUNX3, NR4A1, CD69, CXCR6, and NR4A3),
- 7 cytotoxicity associated genes (PRF1, IFNG, GNLY, NKG7, GZMB, GZMA, CST7, and TNFSF10),
- 5 exhausted markers (CTLA4, HAVCR2, LAG3, PDCD1, and TIGIT)
- 6 costimulatory molecular genes (ICOS, CD226, TNFRSF14, TNFRSF25, TNFRSF9, and CD28)
这个时候千万不要相信chatGPT或者传统教科书
它们根本就没办法在现代单细胞转录组层面的数据分析里面合理,教科书会告诉你仅仅是记忆T细胞又可以细分:
- TEM:效应记忆T细胞(Effector memory T Cell)
- TCM:中枢记忆T细胞(Central memory T Cell)
- Tpm:外周记忆T细胞(Peripheral Memory T Cell)
- TRM:组织驻留记忆T细胞(Tissue Resident Memory)
- TSCM:干细胞记忆T细胞(Stem cell memory T cell)
如果你询问chatGPT单细胞水平CD4的T细胞可以细分哪些:
在单细胞水平上,CD4+ T细胞可以被进一步细分为多种亚型,这些亚型主要根据它们的功能特性、细胞因子产生情况和表面标志物进行分类。以下是一些主要的CD4+ T细胞亚型:
- Th1细胞:这些细胞主要产生干扰素-γ(IFN-γ),对于抵抗细胞内病原体(如病毒和某些细菌)的免疫反应非常重要。
- Th2细胞:这些细胞产生IL-4、IL-5和IL-13等细胞因子,对于抵抗寄生虫感染和过敏反应的调节有重要作用。
- Th17细胞:这些细胞产生IL-17,对于抵抗某些细菌和真菌感染以及自身免疫疾病的发生有重要作用。
- Treg细胞(调节T细胞):这些细胞主要通过产生抑制性细胞因子(如TGF-β和IL-10)或直接细胞间接触来抑制其他免疫细胞的活性,从而维持免疫耐受和防止自身免疫疾病的发生。
- Tfh细胞(滤泡辅助T细胞):这些细胞在淋巴结和脾脏的滤泡区域活动,通过与B细胞相互作用,帮助B细胞产生高亲和力的抗体。
- Th9细胞:这些细胞产生IL-9,与过敏反应和某些自身免疫疾病的发生有关。
- Th22细胞:这些细胞产生IL-22,与皮肤免疫反应和某些炎症反应有关。
以上这些亚型的分类并不是绝对的,因为T细胞的分化是一个动态的过程,同一T细胞在不同的环境条件下可能会表现出不同的功能特性。此外,还有一些其他的CD4+ T细胞亚型,如Th25、Tr1、Th3等,但它们的功能特性和生物学意义还需要进一步研究。
如果你询问chatGPT单细胞水平CD8的T细胞可以细分哪些:
在单细胞水平上,CD8+ T细胞也可以被进一步细分为多种亚型,这些亚型主要根据它们的功能特性、细胞因子产生情况和表面标志物进行分类。以下是一些主要的CD8+ T细胞亚型:
- 效应T细胞(Teff):这些细胞在感染或疫苗接种后迅速扩增并产生大量的细胞因子,如干扰素-γ(IFN-γ),并具有直接杀伤病原体感染细胞的能力。
- 记忆T细胞(Tmem):这些细胞在感染清除后存留在体内,能够在再次遇到同一病原体时迅速激活并扩增,从而提供更快和更强的免疫反应。记忆T细胞可以进一步分为中央记忆T细胞(TCM)和效应记忆T细胞(TEM)。TCM主要存在于淋巴组织,而TEM则主要存在于周围组织。
- 细胞毒性T细胞(CTL):这些细胞具有直接杀伤病原体感染细胞的能力,主要通过分泌穿孔素和颗粒酶等效应分子来实现。
- 老化/耗竭T细胞(Tex):这些细胞在长期或慢性感染以及肿瘤微环境中出现,表现出持久的激活状态,但效应功能受到抑制,这种状态通常被称为”耗竭”。
以上这些亚型的分类并不是绝对的,因为T细胞的分化是一个动态的过程,同一T细胞在不同的环境条件下可能会表现出不同的功能特性。
这些知识点知道一点也是挺好的,但是在单细胞转录组数据里面很难完全匹配。
推荐的标准做法:
使用高表达量基因结合功能基因列表的命名方式是目前很流行的,比如文章:《Bulk and single-cell characterisation of the immune heterogeneity of atherosclerosis identifies novel targets for immunotherapy》,就是先降维聚类分群后,给亚群展现一些重要的功能基因列表:
这个时候反而没有必要给这些单细胞亚群一个生物学名字呢,因为目前单细胞转录组水平还没有权威的生物学命名体系。