美国圣路易斯华盛顿大学的Li Ding团队是TCGA计划的重要发起者和参与者,而TCGA计划大家都很熟悉了,在2012附近就产出了几十篇CNS文章,而且在2018和2020又产出了一两百的CNS子刊级别的TCGA数据挖掘成果,非常的厉害!
最近(2023年底)他们又在《Nature》杂志上合作发表了题为 《Epigenetic regulation during cancer transitions across 11 tumour types》的文章,主要是使用了snATAC-seq与snRNA-seq两个单细胞技术,量化了十几个癌症的两百多个病人的样品。可以理解为单细胞层面的TCGA计划?或者说是TCGA计划的单细胞衍生?
让我们一起来看看这个资源吧,是泛癌层面的表观调控单细胞多组学!首先看样品数量,总共是: 225 samples from 201 patients across 11 cancer types
- 158 primary and 52 metastatic tumour samples and 15 normal adjacent tissues (NATs)
- snATAC-seq analysis of all 225 samples, along with paired single-cell or single-nucleus RNA-seq (sc/snRNA-seq) for 206 of these samples
当然了,并不全部是新产出的数据,还纳入了之前的研究的一些数据,包括: - 14 scRNA-seq multiple myeloma (MM) samples,
- 10 snRNA-seq PDAC samples,
- 14 snRNA-seq glioblastoma (GBM) samples,
- 28 snATAC-seq and 27 snRNA-seq clear-cell renal cell carcinoma (ccRCC) samples
让我们首先看看snATAC-seq的数据分析情况: - The snATAC-seq data encompassed 1,019,175 nuclei from the 225 samples (mean nuclei per sample, 4,530)
- averaging 126,196 ACRs (accessible chromatin regions)per sample, with most appearing in intronic (49%), distal intergenic (30.8%) and promoter (8.6%) regions, as expected (
因为有配套的单细胞转录组数据,所以很容易做细胞亚群注释,联合起来是 sc/ snRNA-seq data yielded 1,157,955 cells or nuclei, - 250,222 immune,
- 69,684 stromal,
- 69,506 normal epithelial
- 588,895 cancer cells
详细的数据情况,可以自行阅读文献:
虽然说数据本身都是在dbGaP里面,需要申请后才有可能访问: - Sequencing data are part of Human Tumour Atlas Network (HTAN) dbGaP Study accession phs002371.v3.p1
- Clinical Proteomic Tumour Analysis Consortium (CPTAC) dbGaP Study accession phs001287.v17.p6.
但是也网页工具可以访问:https://data.humantumoratlas.org/
另外,值得一提的是这些样品本身也有肿瘤外显子数据:Bulk whole-exome sequencing (WES) data were also generated for 195 samples ,所以文献的method里面有大量的肿瘤外显子数据分析环节描述:
我们在《生信菜鸟团》有一个专栏:《肿瘤外显子》
该专栏的目录(节选)如下: - (一)读文献并且下载测序数据
- (二)质控与去接头
- (三)比对
- (四)比对结果的质控
- (番外篇)bam文件载入igv可视化
- (五)GATK的最佳实践
- (六)vcf文件的注释及ANNOVAR的使用
- (七)maftools可视化
- (八)不同注释软件的比较(上):安装及使用
- (八)不同注释软件的比较(中):注释后转成maf文件
- (八)不同注释软件的比较(下):可视化比较maf文件
虽然落脚点是肿瘤外显子的数据分析,但是掌握了这个系列里面的软件安装和数据库资源配置之后,处理普通的外显子数据也不在话下!