单细胞转录组数据发oncotarget

单细胞转录组数据发oncotarget

文章发表于:Oncotarget. 2016; 7:66069-66076. https://doi.org/10.18632/oncotarget.11803 是深圳大学及其附属罗湖医院团队做的,在BGI测序是。题目是:Single-cell analyses of transcriptional heterogeneity in squamous cell carcinoma of urinary bladder 这篇文章就一幅图!!!而且是对一个病人拿的单细胞。

癌症背景知识

很明显,关注的癌症是: squamous cell carcinoma of the bladder (SCCB) ,是膀胱癌症的一种,但是只占10%左右,不过比起占比非常高的urothelial carcinoma (UC)来说,更容易复发,更恶性!

单细胞转录组

不过该文章采用的单细胞转录组方法比较不常见,是 single-cell tagged reverse transcription (STRT) ,使用 Fluorescence Activated Cell Sorting (FACS) 挑选细胞,拿到了 75 tumor cells, 18 normal cells and 3 negative control ,平均每个细胞测序数据量是0.38M ,平均成功比对率是64.87%,具体统计信息可以查看Supplementary Table S1. 唯一的过滤标准是表达基因数量要超过3000,这样剩下 67 tumor cells and 7 normal cells。

使用的是HiSeq2000测序仪,Single-end reads of 50bp were generated along with 8-bp index reads corresponding to the cell-specific barcodes.

数据处理使用的是 Tophat 2.0.12 ,NCBI 37.1 assembly, Reads Per Million (RPM) , 很简单,比较奇怪的是基因表达定量他们居然用自己的perl脚本,我感觉很诡异,现成的featureCounts和HTseq居然不用。

差异分析

很明显,作者把差异分析当做了重头戏,而且完全是把单细胞转录组测序数据用传统的bulk转录组分析方法来处理的,比如使用NOISeq包(参数是; “q = 0.999, graphic = “MD”)来找差异表达基因。统计学显著的上调下调基因就去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。deg-noiseq

高级转录组数据分析

仍然是传统的bulk转录组分析方法,这里用了Weighted Gene Co-expression Network Analysis (WGCNA),挑选5530高表达变异的基因,得到48个模块,然后集中分析前5个比较大的基因模块,同样也是去做GO/KEGG等数据库富集分析,再讨论一下富集分析结果在膀胱癌的生物学意义即可。加多了一个分析,就是在这些模块里面找hub gene,讨论一下这些在膀胱癌的生物学意义即可。 至于WGCNA如何做,看我在菜鸟团博客写的教程即可。

wgcna-hub-genes

单细胞水平的肿瘤异质性

既然是一个病人的67个肿瘤细胞的单细胞表达矩阵,那么没办法很清晰的分群也很正常,这些细胞的相关系数差异很大 r ~ 0.15 to 0.89,说明了肿瘤异质性。然后仅仅是针对那些高表达量基因 (RPM > 100)来根据coefficient of variation (CV)值来挑选the most 100 variably and most 100 stably 基因集,理所当然的,变化剧烈的那些基因是癌症相关的,表达量稳定的那些基因是housekeeping genes。

意义

The fresh tissues (cancer and normal control specimens from one patient) were minced (5-10mm in maximum dimension) during surgery, and kept in cryopreservation medium (10% DMSO+90% DMEM medium with 30% FBS) under -80°C.

病人其实已经去世了!

The patient died six months after the operation because of intestinal metastasis.

Upregulation of CCND1 was uncovered in various cancers, indicating its potential effects on tumorigenesis process, providing a therapeutic target of this patient.

数据可以重新下载并且分析

数据都在NCBI的SRA数据库:SRP078083 ,查看我在生信技能树的教程就很容易理解: https://vip.biotrainee.com/d/334-sra

很容易下载样本列表及原始数据,然后自己重新分析:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP078083

Comments are closed.