TCGA的Pan-Cancer早在2013就系统性提出来并且规划好了,见Nat. Genet. 2013 45:1113),因为TCGA计划涉及到数据类型比较多,仅仅是DNA层面就有WGS、WES、SNP6.0芯片的数据,其中一万多个病人里面有WGS数据的有两千多个病人,而PCAWG计划就是整合所有的WGS数据结果。
ICGC是官网
https://dcc.icgc.org/pcawg 写清楚了两千多个病人的WGS数据来源于哪些项目哪些癌症
同样的,也介绍了ngs数据量,可以看到bam文件是主力:
有4个地方可以浏览探索这些数据
在文章 Online resources for PCAWG data exploration, visualization, and discover 有介绍这4个工具:https://www.biorxiv.org/content/10.1101/163907v5
分别是:
- The ICGC Data Portal, :https://dcc.icgc.org/pcawg
- UCSC Xena, :https://xenabrowser.net/datapages/?hub=https://pcawg.xenahubs.net:443
- Expression Atlas,
- PCAWG-Scout.