通常多组学就是全外显子和转录组而已,这个规律早就提现在了各个国家地区的队列之中,本研究也不例外,发表在:Nat Commun. 2019 Apr,是中国肺癌研究领域比较出名的吴一龙课题组
队列病人情况
非小细胞肺癌的鳞癌和腺癌都有,总共245个患者,命名为 CHOICE 队列,如下:
CHOICE队列和TCGA队列的非小细胞肺癌的鳞癌和腺癌的拷贝数变异的比较
主要就是比较TCGA队列的非小细胞肺癌的鳞癌和腺癌的GISTIC2算法得到的amplification 和 deletions和中国人的队列的差异,展现如下;
这样的比较可以有四次。
CHOICE队列和TCGA队列的非小细胞肺癌的鳞癌和腺癌的点突变比较
点突变跟拷贝数变异不一样,并没有去区分扩增和缺失,所以只需要区分鳞癌和腺癌比较两次即可,如下:
突变全景图和突变频率最高的30个基因的区别如下:
免疫浸润情况
因为有转录组数据,所以可以推测免疫浸润的各种免疫细胞比例,然后可以比较非小细胞肺癌的鳞癌和腺癌的差异,如下:
也可以比较吸烟和不吸烟的群体的差异。
使用ssGSEA算法计算26 immune cell types比例
这26个基因集来源于文章 Immunity. 2013 Oct , 分类如下;
- 11个是adaptive immunity
- 12个是 for innate immunity
- 3个是 for MDSC,angiogenesis, and antigen presentation machinery
使用GSVA包的ssGSEA算法,对z-score后的RNA-seq表达矩阵进行分析。有趣的是作者提供了RPKM矩阵哦,The RNA-seq FPKM data have been deposited at figshare (https://doi.org/10.6084/m9.figshare.7306364.v1). 所以理论上可以重现作者的分析。
可以把病人分成3组不同的免疫状态,主要是看 IFNG, PD-L1, PD-1, and CD8 基因的表达,如下:
然后分组后可以比较他们的突变表现, 从SNV,CNV角度来看,然后发现PTEN和PIK3CA的表达量跟T细胞指标有相关性。