发表于:Oncotarget. 2018; 文章是:Single-cell RNA sequencing reveals gene expression signatures of breast cancer-associated endothelial cells 作者使用scRNA-seq手段量化了人类乳腺癌来源的内皮细胞与正常的内皮细胞的表达量,找差异基因并且使用GSEA方法注释。
其实作者的数据量不少啊,分析也做的蛮多的,不知道他们为什么要投Oncotarget,唉
已经有十多个比较癌症来源的内皮细胞和正常内皮细胞表达量区别的文章了,但他们忽略了癌症来源的内皮细胞本身的异质性,需要单细胞技术来探索。所以作者使用Smart-seq2技术做了单细胞转录组测序。
名词解释:
- Tumor endothelial cells (TEC)
- extracellular matrix (ECM)
单细胞转录组流程
实验纳入了88个来源于乳腺癌的内皮细胞以及192个来源于整容手术的正常人乳腺的内皮细胞,总共是280个内皮细胞。
单细胞转录组数据质控
但是测序数据质控只挑选有一百万条reads的细胞,剩下74个乳腺癌来源的内皮细胞和72个对照。
挑选那些RPKM>1 的基因,共6,865 个基因表达。
主成分分析
选取top 100 genes with highest score PC1-3做热图:
单细胞转录组数据差异分析
作者使用了SINGuLAR包,从6,865 个基因挑选了1,302 基因是显著差异表达的。然后对这些基因使用在线网页工具做 MetaCore disease biomarker分析,其中3个是:
- breast neoplasm chemokines
- breast neoplasm estrogen receptor 1
- breast neoplasm G-protein coupled receptor (GPCR) pathway regulation
而且跟信号通路也相关: - ell adhesion
- cytoskeleton remodeling
- immune response
看这样作者并不会R语言,现在很少见了。
在线工具地址是:GeneGo MetaCore (https://portal.genego.com/)GSEA分析
大名鼎鼎的GSEA分析,输入是全部的基因,作者主要针对Gene Set Enrichment Analysis (GSEA) databases里面的3个经典数据库:
- Kyoto Encyclopedia of Genes and Genomes (KEGG)
- Reactome
- Gene Ontology (GO)
结果也很显而易见,一些是内皮细胞相关通路: - extracellular matrix (ECM) metabolism
- vascular smooth muscle contraction
- collagen formation
- complement and coagulation
- drug metabolism
- cancer pathways
- axon guidance
主要是解读分析结果里面的: - 30 genes were enriched by KEGG database for ECM receptor interaction pathway
- 20 genes were enriched by Reactome database for ECM organization pathway
- 116 genes were enriched by Gene Ontology database for ECM-related pathway
TCGA数据库验证
作者使用自己数据分析得到GSEA-enriched ECM-associated 基因(116 genes,GO数据库)去TCGA里面获取表达量矩阵,做聚类热图,还有条形图看差异。
这次缩小到46 ECM-associated个基因。Oncomine cDNA microarray数据库再次验证
这次缩小到12个基因,总体上在20种癌症都有差异。
值得一提的是Oncomine cDNA microarray database (http://www.oncomine.org) 数据库并非是完全开放使用,需要教育邮箱地址才能申请使用。再到cBioPortal看着12个基因的突变情况
但是只有COL6A3 基因突变频率是4%左右,其它基因突变频率都是在1%一下。
然后证明这些marker是跨癌症通用的
还是使用公共数据集,Published microarray data sets of TECs from 13 colon cancer patients (GSE89287) and 4 lymphoma patients (GSE8852), 看到了specific high expression of 7 out of these 12 ECM associated genes in TECs from colorectal cancer and lymphoma,也就是说这7个基因是跨癌症通用的的ECM的markers。
大家可以看看另外一篇nature medicine文章对比一下文章思路及分析流程
乳腺癌(BC)中肿瘤浸润淋巴细胞(TIL)的数量是改善患者存活率的有力预后因素,特别是在三阴性和HER2过表达的乳腺癌亚型中。尽管T细胞是TIL的主要群体,但T细胞亚群的定量和定性差异与患者预后之间的关系仍然未知。我们对从人类BC中分离的6,311个T细胞进行了单细胞RNA测序(scRNA-seq),并显示在浸润的T细胞群中存在显着的异质性。我们证明具有大量TIL的BC含有CD8 + T细胞,其具有组织驻留记忆T(TRM)细胞分化的特征,并且这些CD8 + TRM细胞表达高水平的免疫检查点分子和效应蛋白。
从scRNA-seq数据开发的CD8 + TRM基因标签与早期三阴性乳腺癌(TNBC)中患者存活率的改善显着相关,并且提供比单独的CD8表达更好的预后。
我们的数据表明CD8 + TRM细胞有助于BC免疫监视,并且是免疫检查点抑制调节的关键目标。进一步了解TRM细胞的发育,维持和调节对于BC成功的免疫治疗发展至关重要。