单细胞转录组揭示乳腺癌病人异质性
单细胞转录组在癌症研究领域应用价值很大,包括:
- Non-invasive monitoring of circulating tumour cells
- estimation of tumour heterogeneity
- early detection of small numbers of recurrent tumours
- sensitive monitoring of rare cell populations
招募的乳腺癌患者基本情况
虽然只有11个病人的数据,但是涵盖了4种乳腺癌的分类;
- ER-positive (BC01 and BC02; luminal A)
- ER/HER2-positive (BC03; luminal B)
- HER2-positive (BC04, BC05 and BC06; HER2)
- triple- negative (BC07–BC11; TNBC) invasive ductal carcinoma
因为提取的单细胞并没有进行FACS筛选,所以包括以下; - 癌症细胞
- 非癌细胞
- fibroblasts
- adipocytes
- endothelial cells
- diverse immune cells
单细胞转录组数据
用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit
去除低质量细胞:
- (1) number of total reads;
- (2) mapping rate;
- (3) number of detected genes;
- (4) portion of intergenic region.
去除低质量基因 - First, TPM values < 1 were considered unreliable and substituted with zero.
- Second, TPM values were log2-transformed after adding a value of one.
- Third, genes expressed in < 10% of all tumour groups were removed.
最后剩下 515单细胞和17,779基因!
单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。
Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.外显子数据
外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。
外显子数据在 SRP067248 可以下载,共24个测序文件。
肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。CNV对细胞进行分类
总共的 515单细胞根据CNV模式可以分成
- 317 epithelial breast cancer cells
- 175 tumour-associated immune cells
- 23 non-carcinoma stromal cells
这里的CNV分析算法相比broad提出的算法改进了,采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (http://www.gtexportal.org/). 如下图:
区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;
同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。
很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:
功能分析
检查了包括:
- epithelial–mesenchymal transition (EMT)
- stemness
- angiogenesis
- proliferation
- recurrence
这些重要的功能通路。
计算一下signature scores
这里使用的是 ESTIMATE 算法:
- Tumour score
- Stromal score
- immune signature
这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:
两个重要的R包:
- GSVA software in the R package
- Molecular subtypes of tumours were predicted using the R package genefu.
- ER module score
- HER2 module score