癌相关的成纤维细胞 CAFs,具有异质性,是TME中的重要细胞成分,分泌的特定细胞因子、炎症趋化因子及其它可溶性因子能够诱导减缓细胞循环的过程,从而影响肿瘤细胞的增殖;2018年12月的NC文章:Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing 使用成熟的单细胞转录组( Smart-seq2 )手段探索了癌相关的成纤维细胞 CAFs的功能和空间异质性。
Here, we use the highly sensitive Smart-seq2 protocol to delineate the heterogeneity of 768 CAFs isolated from the genetically engineered MMTV-PyMT mouse model of breast cancer
名词背景
- single cell RNA sequencing
- Cancer-associated fibroblasts (CAFs) / tumor-supportive CAF
- extracellular matrix (ECM)
- epithelial-to-mesenchymal transition (EMT).
- MMTV-PyMT mouse model
- a negative selection fluorescence-activated cell sorting (FACS) strategy
- the negative selection markers Epcam, Pecam1, and Ptprc
- to isolate an EpCAM−/CD45−/CD31−/NG2− cell fraction devoid of epithelial cells, immune cells, endothelial cells, and pericytes, respectively
- Smart-seq2 protocol
- External RNA Controls Consortium (ERCC) spiked in
- principal-component analysis (PCA)
- t-distributed stochastic neighbor embedding (t-SNE)
- single cell differentially expressed genes (SCDE)
- reproducibility-optimized test statistic (ROTS)
- differentially expressed genes/significantly differentially expressed (SDE)
- log2(RPKM + 1)
- PAM50 proliferation metagene
- METABRIC cohort
- The Cancer Genome Atlas (TCGA) database
- six commonly used mesenchymal cell markers
- endothelial cell metagene in breast tumors
CAFs 的背景知识
细胞来源
- resident fibroblasts
- bone marrow-derived mesenchymal stem cells
- pericytes
- malignant cells or endothelial cells
cellular markers - α-smooth muscle actin (SMA)
- fibroblast-specific protein 1 (FSP-1/S100A4)
- fibroblast activation protein (FAP)
这些背景知识在文章的introduction部分有介绍:
)
根据相应的分子标记,就可以特异性的分选CAFs进行研究:
单细胞分群及定义
主要分析是tSNE,然后挑选
first 150 SDE genes
绘制热图 - 并且进行gene ontology (GO)
注释来确定不同组的细胞功能: - Population 1 vascular CAFs (vCAFs). 细胞数量最多
- Population 2 were named matrix CAFs (mCAFs).
- Population 3 cells were termed cycling CAFs (cCAFs). 是vCAFs过渡阶段
- Population 4 developmental CAFs (dCAFs).
如下:
可以挑选一些有确切生物学意义的基因
可视化它们在这些不同群细胞的表达量分布情况:
既然很明确的分成4组,那就可以进行差异分析,挑选差异基因绘制热图:
同样的是GO分析注释细胞亚群
的功能:
值得注意的是: cCAFs represent theproliferative segment
of vCAFs 所以最后作者认为是3群细胞,如下图:
其中:vCAF marker Nidogen-2, the mCAF marker PDGFRα, and the dCAF marker SCRG1,这个很重要,需要仔细看作者是如何分析的。
第4群细胞也很特殊,高表达 PyMT , 说明它是肿瘤相关细胞了。
它们3群细胞的ECM相关基因表达模式差别很明显。6个公共基因集
包括:
- EC metagene (CDH5, CXorf36, TIE1)
- Microvasculature
- Stroma 1
- Stroma 2
- ECM metagene (COL1A1, COL1A2, COL3A1)
- Proliferation
主要是结合TCGA这样的公共数据库:
还有在METABRIC数据库的:
还有在一篇文章的:
单细胞转录组
数据是公开的: GSE111229 代码也是有的: GitHub [www.github.com/KPLab/SCS_CAF].
其ngs测序数据的处理方式也是在methods有详细描述,很容易follow一遍。
首先单细胞数据需要根据一定的指标进行过滤:
最后作者得到的表达矩阵可以直接在GEO数据库里面现在,这样没有服务器的小伙伴就可以在此基础上面走下游分析流程。关于metagene
每个分组的细胞都有特定的基因集,比如作者分析的top 150的DEGs,也可以通过算法局限到一个基因,就是metagene,看看这个在临床分组的表现情况: