看到了一个综述,标题是 :《ID4 controls luminal lineage commitment in normal mammary epithelium and inhibits BRCA1 function in basal-like breast cancer》,提到了: Inhibitor of differentiation (ID) 基因家族的ID4这个基因的两面性,如下所示:
首先,ID4这个基因在正常的前列腺组织里面是高表达的,在前列腺癌症组织里面表达量会降低,而且是随着癌症进展而逐渐降低的,是一个非常标准的抑癌基因失活的例子。
但是在膀胱癌里面,是原癌基因的角色,它要么在肿瘤组织里面高表达要么拷贝数会扩展 :
我相信这样的基因数量不在少数,它们在TCGA数据库的不同癌症里面,有完全相反的趋势。
首先作为一个简单的学徒作业,针对ID4这个基因去TCGA数据库看看BLCA和PRAD两个数据集里面它是不是表现迥异,而且看看是否有癌症分级的变化趋势。算是对这个综述的一个验证!
然后提出一个高阶学徒作业,去看TCGA数据库的全部肿瘤数据集,把基因根据在各自肿瘤和对照表达差异降低或者升高二分类,选择那些在全部癌症都是高表达的基因,以及在全部癌症都是低表达的基因,还有那些一半一半的基因,这3个基因列表拿去做GO和KEGG数据库注释。
推荐看一个综述:Tumor Suppressors Having Oncogenic Functions: The Double Agents
其实就是TCGA数据库的全部肿瘤数据集,都是可以分成肿瘤组和对照组,进行简单的差异分析即可,我的要求也不高哦!
差异分析相信大家都不陌生了,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;