有点意思啊,两次都能定位到关键基因和通路!

我们这个月的马拉松生信入门课程进行到了表达量数据分析单元课,虽然说目前授课的案例主要还是基于20多年前的芯片技术的文章,但是数据分析的策略是一通百通的, 表达量矩阵可以来自于转录组测序技术,亦或是蛋白质组技术。
常规的表达量矩阵只需要实验设计合理,比如两分组的,就可以不管三七二十一,差异分析走起,上下调基因判断ok了,就火山图热图画出来了。这些常规的分析相信大家都不陌生了,基本上看我10年前的表达芯片的公共数据库挖掘系列推文即可;

  • 解读GEO数据存放规律及下载,一文就够
  • 解读SRA数据库规律一文就够
  • 从GEO数据库下载得到表达矩阵 一文就够
  • GSEA分析一文就够(单机版+R语言版)
  • 根据分组信息做差异分析- 这个一文不够的
  • 差异分析得到的结果注释一文就够
    不过学员群小伙伴们很喜欢举一反三,拿他们看到的自己的领域相关文献来考我们表达量矩阵数据分析关键的知识点。比如其中一个小伙伴就分享了这个《Thrombospondin-1 Regulates Trophoblast Necroptosis via NEDD4-Mediated Ubiquitination of TAK1 in Preeclampsia》,文章虽然也是常规的差异分析+生物学功能数据库注释,但是两次都能定位到关键基因和通路,想问我们有什么技巧!

    首先做了一个蛋白质组学实验

    这个研究的实验设计是对七个胎盘样本(包括三例重度PE患者和四例正常孕妇)进行了TMT定量蛋白质组学分析,差异分析的结果是:74个上调蛋白和66个下调蛋白(sPE/NP倍数变化>1.2或<0.83,p<0.05),如下所示的火山图和go数据库的注释结果:
    火山图和go数据库的注释
    这个很简单的,任意科研服务公司都可以帮忙对大家的样品进行蛋白质组学实验而且返回处理好的表达量矩阵,接下来就是简单的差异分析+生物学功能数据库注释,完全等同于我们授课的表达量芯片或者转录组测序的矩阵分析。
    如下所示的说kegg数据库的注释结果,以及统计学显著的上下调蛋白质的表达量热图:
    统计学显著的上下调蛋白质的表达量热图
    这个时候大家肯定是有一个疑惑,我们做任意组学,表达量芯片,转录组测序,或者蛋白质组,都是高通量的,必然是有成百上千个统计学显著的差异结果。比如上面的74个上调蛋白和66个下调蛋白,如何从这里面找到关键的单个目标基因确实是玄学。
    这个时候研究者们选择了PPI分析:

  • The PPI network revealed the links of the DEPs and found that proteins, such as GAPD, ALB, THBS1, and LDHB, were in the core location
  • THBS1 was one of the DEPs that was significantly down-regulated in the placentae of patients with sPE, and it has the largest number of GO entries in the GO database
    就定位到了THBS1这个基因:
    蛋白质-蛋白质相互作用网络分析
    蛋白质-蛋白质相互作用(Protein-Protein Interaction, PPI)分析是一种系统生物学方法,用于识别和量化蛋白质之间的相互作用,并构建蛋白质相互作用网络。在处理高通量数据,如转录组测序、表达量芯片或蛋白质组学数据时,PPI分析可以提供以下帮助:
  1. 确定关键基因或蛋白质:通过分析蛋白质相互作用网络,可以识别中心或枢纽蛋白质(Hub proteins),这些蛋白质可能在生物学过程中起到关键作用。关键基因或蛋白质往往是网络中连接度高的节点,可能参与多个生物学途径或对疾病有重要影响。
  2. 功能注释和途径分析:PPI分析可以帮助将无差异表达的基因或蛋白质与已知的生物学功能或途径联系起来,从而提供对生物学变化的更深入理解。
  3. 系统层面的理解:高通量数据通常关注单个基因或蛋白质的变化,而PPI网络提供了一个系统层面的视角,有助于理解基因或蛋白质如何在网络中协同作用。
  4. 验证和假设生成:PPI分析可以揭示新的生物学假设,为后续的实验验证提供目标。
  5. 疾病和药物靶标发现:在疾病相关研究中,PPI分析有助于识别可能的疾病生物标志物或药物作用的靶标。
    然而,PPI分析也有其局限性:
  • 数据质量和完整性:PPI网络的准确性依赖于底层数据的质量。如果原始数据存在偏差或错误,网络分析的结果也可能受到影响。
  • 动态性和复杂性:生物网络是动态变化的,受到多种因素的影响,包括环境、发育阶段和疾病状态。PPI分析通常是静态的,可能无法完全捕捉这种动态性。
  • 计算挑战:构建和分析大型PPI网络可能需要大量的计算资源。
    因此,虽然PPI分析是一个强大的工具,可以帮助定位关键基因或蛋白质,但它应该与其他生物学方法和实验验证相结合,以获得更全面的理解。

    然后干扰这个THBS1基因即可

    转录组测序(RNA-Seq)是一种高通量测序技术,可以在全基因组水平上定量分析细胞中所有mRNA的表达水平。通过比较基因过表达或敲减前后的转录组数据,研究人员可以获得关于基因如何调控细胞过程的详细信息。这种方法可以揭示基因表达的变化,发现新的生物学标记,以及理解基因表达调控的复杂性。在生物学和医学研究中,对特定基因进行过表达(过表达,即让基因表达水平高于正常生理状态)或敲减(降低基因表达水平,包括完全敲除或部分抑制)是一种常用的功能性分析方法。通过这些技术,研究人员可以探究基因的功能以及它们在生物学过程或疾病发生中的作用。以下是进行这类实验的几个主要原因:

  1. 基因功能鉴定:通过过表达或敲减特定基因,研究人员可以观察到细胞表型或生物体的表型变化,从而推断该基因的生物学功能。
  2. 疾病机制研究:在疾病状态下,某些基因的表达水平可能会发生改变。通过模拟这些改变,研究人员可以更好地理解这些基因如何影响疾病的发展。
  3. 药物靶点发现:通过敲减基因表达并观察细胞对药物的敏感性变化,研究人员可以识别潜在的药物靶点。
  4. 信号通路分析:基因过表达或敲减可以帮助揭示基因间的相互作用以及它们在信号传导通路中的位置和作用。
    常见的转录组实验设计就是干扰一下目标基因,然后两分组每个组内3个样品,是因为早期转录组测序费用昂贵。如果是二十年前做一个转录组样品可能会过万的费用,十年前就千把块钱了,五年前就五六百块钱,现在就三百多块钱了。详见:转录组价格腰斩哈!(优化升级后单个样本仅399元)所以,建议大家敲减过表达前后转录组差异最好是都做一下,向CNS期刊看齐!比如2024的CELL文章:《A TCF4-dependent gene regulatory network confers resistance to immunotherapy in melanoma》
    但是这个文章做的是sh-THBS1和sh-NCHTR8/SVneo两分组的RNA-seq,差异分析后拿到了238个DEGs,其中128个上调基因和110个下调基因,如下所示的火山图和kegg数据库注释结果:
    火山图和kegg数据库注释结果
    从这个结果里面,研究者们注意的了 a remarkable up-regulation of necroptosis but had little effect on apoptosis ,其实仍然是跟前面的蛋白质组学差异分析同样的难点,因为也是成百上千个基因有统计学显著的改变,哪怕是注释到kegg这样的生物学功能数据库也是有很多条目。但是,神奇的地方来了,这个时候作者需要引入生物学背景知识:
  • Z-nucleic acid-binding protein 1 (ZBP1) and TAK1 act as master regulators of PANoptosis, which includes pyroptosis, apoptosis, and necroptosis
  • The activation of ZBP1and inhibition of TAK1 can trigger necroptosis
    毫无疑问,程序性细胞死亡(programmed cell death, PCD)现在是科研界的当红炸子鸡,上面提到的Necroptosis 和 PANoptosis 是两种不同的细胞死亡形式。
  1. Necroptosis:
    • 定义: Necroptosis 是一种受调控的细胞死亡形式,与凋亡(apoptosis)不同,它是一种更为炎症性的细胞死亡方式。
    • 机制: 它通常由死亡受体信号通路激活,当凋亡途径受阻时发生。Necroptosis 涉及细胞膜的破裂和细胞内容物的释放,这可以触发炎症反应。
    • 关键蛋白: 该过程中的关键蛋白包括RIPK1(受体相互作用蛋白激酶1)、RIPK3和MLKL(混合谱系激酶结构域样蛋白)。
  2. PANoptosis:
    • 定义: PANoptosis 是一种相对较新的概念,指的是细胞在多种死亡信号的作用下,表现出凋亡(apoptosis)、坏死(necrosis)和坏死性凋亡(necroptosis)的特征。
    • 机制: PANoptosis 描述的是细胞在面对不同类型的死亡信号时,可能出现的混合型细胞死亡现象。这种死亡方式可能涉及到多种细胞死亡途径的激活。
    • 特征: PANoptosis 可能同时具有凋亡的形态学特征(如细胞萎缩、核凝聚)和坏死性凋亡的炎症性特征(如细胞膜破裂、细胞内容物释放)。
      如果科研界的明星基因和明星通路,科研热点发生了变化,我相信这个文章肯定是就会挑选其它的基因或者通路吧。这个已经不是生物信息学数据分析能解释的了。

Comments are closed.