众所周知,单细胞水平的研究,就是为了深入了解异质性,除了可以区分已知的细胞亚型,还可以对亚型进一步细分,或者找到全新的细胞亚型。当然了,每个细胞亚型的marker基因需要一些生物学背景。
比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumor microenvironment. 共选取5例病人的共19个样本,通过10×genomics单细胞转录组测序探索基质细胞的亚群分类、基因功能(信号通路)、关键marker基因和临床预后。共鉴定出52个基质细胞亚群,反映了肿瘤微环境复杂性。对基质细胞的marker基因做生存曲线,发现这些marker基因可以作为肺癌预后诊断的潜在标志物。
如下所示,就是先初步分群,再细分群
其实就是我一直讲解的单细胞流程,基本上学习5个R包就够用了, 而且分析流程也大同小异:
单细胞R包如过江之卿,入门的话我推荐大家学习5个R包,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 而且分析流程也大同小异:
- step1: 创建对象
- step2: 质量控制
- step3: 表达量的标准化和归一化
- step4: 去除干扰因素(多个样本整合)
- step5: 判断重要的基因
- step6: 多种降维算法
- step7: 可视化降维结果
- step8: 多种聚类算法
- step9: 聚类后找每个细胞亚群的标志基因
- step10: 继续分类
初步分群就用Seurat
比如发表在 PNAS September 24, 2019 的文章The single-cell transcriptomic landscape of early human diabetic nephropathy ,链接 https://doi.org/10.1073/pnas.1908706116
收集了 23,980 single-nucleus transcriptomes from 3 control and 3 early diabetic nephropathy samples. 平均每个细胞有 2,541 genes and 6,894 unique molecular ,使用Seurat就可以初步分群拿到Eleven kidney cell types和four immune cell types ,
这些细胞类型全称如下,应该是只有专门研究这个领域的看到这些简称才不会陌生: - PCT, proximal convoluted tubule;
- CFH, complement factor H;
- LOH, loop of Henle;
- DCT, distal convoluted tubule;
- CT, connecting tubule;
- CD, collecting duct;
- PC, principal cell;
- IC, intercalated cell;
- PODO, podocyte;
- ENDO, endothelium;
- MES, mesangial cell;
- LEUK, leukocyte.
需要有相关生物学背景知识,才知道根据哪些marker基因来对群进行命名,这个图也是单细胞的标配:
可以看到 LEUK, leukocyte.的 marker基因是PTPRCCoding sequence variants identified in PTPRC (human CD45)
Protein tyrosine phosphatase, receptor type, C also known as PTPRC is an enzyme that, in humans, is encoded by the PTPRC gene.[5] PTPRC is also known as CD45 antigen (CD stands for cluster of differentiation), which was originally called leukocyte common antigen (LCA).[6]
对leukocyte细分亚群
这个就是大家比较熟悉的啦,各种免疫细胞。提取这个leukocyte的表达矩阵,继续跑Seurat流程:
同样的,细分的亚群也是有自己的marker基因,可以看到B细胞和T细胞就很不一样。
如果是10X仪器的单细胞转录组数据走cellranger流程,我们在单细胞天地多次分享过流程笔记: - 单细胞实战(一)数据下载
- 单细胞实战(二) cell ranger使用前注意事项
- 单细胞实战(三) Cell Ranger使用初探
- 单细胞实战(四) Cell Ranger流程概览
- 单细胞实战(五) 理解cellranger count的结果
拿到表达矩阵后再走Seurat流程哦。最后一个思考题
细胞分群后细胞亚群是无限划分的吗?