转录组测序后差异分析大家应该是都不陌生了,现在的生命科学领域的研究如果不加入一个转录组都会让人很奇怪,慢慢的它的地位开始赶上传统的PCR(聚合酶链反应)或者Western Blot(WB,蛋白质印迹)等技术。
如果一个转录组测序项目只有两个分组,那么简单的单次差异分析即可。但是如果有3分组就麻烦了,简单的理解就是两个处理组去和一个对照组差异,然后这两次差异分析的结果可以去对比一下,比如取交集。如下所示的案例:
实际上,在进行差异分析时,如果有三组数据(组A、组B和组C),不仅仅是上面的两次差异分析这样的可能性。以下是一些常见的比较组合:
- 组A vs 组B:比较第一组和第二组之间的差异。
- 组A vs 组C:比较第一组和第三组之间的差异。
- 组B vs 组C:比较第二组和第三组之间的差异。
- 组A vs (组B + 组C):将组B和组C的数据合并,与组A进行比较。
- 组B vs (组A + 组C):将组A和组C的数据合并,与组B进行比较。
- 组C vs (组A + 组B):将组A和组B的数据合并,与组C进行比较。
- 每组与所有其他样本的总体比较:在某些情况下,你可能想要比较每组与所有其他样本的总体平均的差异。
- 成对比较:除了上述直接的两两比较,还可以进行成对比较,即比较每一对样本之间的差异。
- 时间序列或剂量反应比较:如果组A、B、C代表时间点或剂量水平,可以比较时间或剂量效应,如组A(时间点1)vs 组B(时间点2)vs 组C(时间点3)。
- 组合比较:可以创建组合的虚拟组,比如将组A和组B的样本合并,然后与组C进行比较,以探究两组间的共同效应或特定效应。
选择哪种比较组合取决于你的研究设计、科学问题和统计测试的要求。在进行差异分析时,重要的是要考虑到多重假设检验的问题,因为多次比较会增加发现假阳性结果的风险。因此,可能需要使用适当的统计校正方法,如Bonferroni校正、Benjamini-Hochberg程序或FDR(False Discovery Rate)控制等。
也就是说,每增加一个分组, 可以选择的分析策略就呈几何的增加,非常恐怖!当然了,大部分情况下,数据分析是需要有生物学背景的指导,我们不可能说是为了分析而分析,比如2019的文章:《Genetic pathway analysis reveals a major role for extracellular matrix organization in inflammatory and neuropathic pain》, 虽然是9个小鼠分成3组后取36个样品做转录组测序,也就是说是12个分组,如下所示:
首先是小鼠有三分组, 每个组里面是3只小鼠,一个分组是对照的小鼠,另外使用了两种小鼠模型来模拟疼痛状态,:
- 一种是使用完全弗氏佐剂(Complete Freund’s Adjuvant, CFA)诱导的炎症性疼痛(IP)
- 另一种是通过脊髓神经损伤(Spared Nerve Injury, SNI)模型诱导的神经性疼痛(NP)。
然后是涉及到了 小鼠的四个组织(背根神经节、脊髓、大脑和血液): - whole brain (BRN), spinal cord (SC), dorsal root ganglion (DRG), and whole blood (BLD).
让我们一起看看文章到底是做了多少差异分析,首先是每种组织里面都是可以做疼痛小鼠模型和正常对照小鼠的差异:
上面的两种疼痛小鼠模型还可以在每个组织里面独立的取交集:
其实这个时候或许mfuzz或者wgcna这样的针对基因进行直接分组的算法可能会好一点,这个文章就没有做,未必就不能作为一个公共数据挖掘的课题啦, 当然了,如果是结合类似的实验设计的单细胞转录组数据就更容易得出有意义的生物学结论了,这一切的前提是有生物学背景而不仅仅是跑生物信息学软件工具啦。
而且,这样的公共数据集理论上是足够多的,因为疼痛研究领域也不小众,比如上面的文章就对比了3个公共数据集: - rat spinal cord 7 days SNI vs sham (GEO set GSE18803),
- rats DRG ipsilateral 7 days SNI vs sham (GEO set GSE15041),
- rats DRG 3 days CFA vs sham (GEO set GSE38859).
一个课题可以分析十年送上百个研究生毕业
如果真的是从数学角度来看上面的12组的差异分析,组合起来这个课题可以分析十年送上百个研究生毕业。。。
而且现在这样的36个样品做转录组测序就万把块钱,还比不上一个单细胞转录组样品的费用。
下面是广告时间哈!
如果你恰好有类似的实验设计想做一下多分组的复杂转录组,不妨联系我们。
NGS测序产品非常多,其中不乏单价高、利润高的好产品,如单细胞、表观等。不过我们综合评估了自己的能力,以及对朋友负责的态度,仅让健明老师帮忙对我们的转录组进行了推荐。转录组产品的价格低利润薄,于公司而言单个小项目能投入的精力是非常有限的;于很多老师而言,长期高效的售后却又是必须的。
我们自团队组建以来我们一直秉承着“让数据发挥价值”的理念,不断地做项目总结、经验整理、产品优化。我们对每个项目做无限期的售后,几乎没有收过任何售后费用。之所以敢这么干,一方面是因为我们认为大家都能够相互尊重、相互理解,另外就是转录组我们实在太熟悉了。
同时为了方便一部分客户自己作图的需求,我们也搭建了针对转录组分析的云平台。当然云平台绝不是我们减少自己和客户沟通售后的理由。
我们最近对转录组进行再次优化升级,单个样本仅399元(真核生物),虽然价格很低,不过依然是支持长期售后,售后内容包括转录组结果讲解、调整参数重新分析、优化作图等。
联系就送mfuzz或者wgcna这样的针对表达量矩阵里面的基因进行直接分组的算法的实例哦!