在KRAS-TRP53基因驱动的LADC依赖于rRNA的合成依赖于Ect2基因

KRAS-TRP53基因驱动的LADC依赖于rRNA的合成依赖于Ect2基因

今天JC的时候,同学分享的是一个比较难懂的文章,我尝试着follow她,但失败了。文章发表于2017年1月的CELL,是 Ect2-Dependent rRNA Synthesis Is Required for KRAS-TRP53-Driven Lung Adenocarcinoma , 里面太多陌生的名词,如下:

  • nucleolar transcription factor upstream binding factor 1 (UBF1)

  • guanine nucleotide exchange factor (GEF) epithelial cell

  • transforming sequence 2 (Ect2) - oncogene

  • rRNA synthesis

  • rDNA promoters

  • lung adenocarcinoma (LADC)

  • KRAS-TRP53-Driven Lung Adenocarcinoma

  • CD24+/ITGB4+/NOTCH3hi (3+) lung epithelial cells

  • Madin-Darby canine kidney (MDCK) epithelial cells

  • Lentiviral short hairpin RNA (shRNA)-mediated knockdown (KD)

  • mouse-specific Ect2 shRNAs

  • cytoplasmic Rho GTPases

  • Ect2 nuclear localization signal [NLS]

  • H358 and H23 cells

  • anti-rheumatoid agent auranofin (ANF)

太多了,我都懒得继续看了。

不过,这样的大文章已经不可避免的利用公共数据了,比如TCGA。对我来说,这反而是非常简单的了,我就来试着解读一下。

TCGA表达量看共表达情况

Co-occurrence analysis of the TCGA LADC dataset (n = 517) for expression of ribosomal processing genes and Rho family GEFs. Significant co-occurrences shown in red and exclusivity in blue.

如果要重复这个图,需要下载表达矩阵,然后要根据文献找到那 286 validated human ribosomal processing genes ,然后跟作者感兴趣的那十几个基因比较即可。

TCGA查询某两个基因的表达相关性

[

这里作者并没有选取全部的LADC数据,而是选取其中的有KRAS基因突变的样本,所以需要同步下载WES数据的MAF文件,查询突变的那19个样本ID,再去表达矩阵里面查询并且作图。

对共表达结果热图进行统计

这个很简单,就是数一数上面的热图,对每个基因统计一下有多少个显著的 ribosomal processing genes 。

统计结果再过滤

只留下KRAS基因突变的样本,后再进行统计分析。

生存分析

这个有很多在线工具可以做了:

Comments are closed.