两个基因组合起来对样品分组后差异分析和生存分析

有很多小伙伴表示看到了我们的永久免费的生信进阶培训(线下)通知,但是不知道如何才算是有基础生物信息学数据分析能力是可以过来的,其实很简单的,就是可以独立完成下面的推文图表 :

  • 不同差异分析方法拿到的上下调基因影响什么了?
  • 两种让你的样品分组看起来更为合理的方法
    虽然说“心向往之”,但是大家可能会还是有疑惑,来我们这里可以学什么,除了 永久免费的生信进阶培训(线下) 提到的我整理好的ngs多组学的全套,以及单细胞的一条龙资料之外,更多的就是一起探讨文章里面的图表复现的可能性:
    比如我刚刚看到了新鲜出炉(2024年04月 )的单细胞文章:《An immune cell map of human lung adenocarcinoma development reveals an anti-tumoral role of the Tfh- dependent tertiary lymphoid structure》里面有一个简单的TCGA数据挖掘图表,是figure4的C,就可以成为一个学习的点:

    (C) Volcano plots showing differentially expressed genes (DEGs) of TCGA patients with LUAD in stage I grouped by the expression levels of CD4 and CXCL13
    就是需要去tcga数据库里面拿到肺癌数据集,然后以及数据库记录的病人临床信息取里面的stage1的子集后,根据这两个基因( CD4 and CXCL13)组合起来对病人分成高低两组后做差异分析,非常适合做一个学徒考核:
    高低两组后做差异分析
    大家可以选择任意自己感兴趣的基因的表达量矩阵,依旧任意的两个你比较熟知的基因去对病人划分组别后做差异分析。

    思考题:多个基因如何组合去对样品分组呢

    多个基因组合起来就是基因集啦,就可以在样品里面进行打分,打分的算法就五花八门了,样品有了打分这样的连续值就可以高低可以。
    另外多个基因组合起来可以提取子集表达量矩阵,然后可以层次聚类或者主成分分析后,都可以把样品划分两个组别。

    文末友情宣传

    强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

  • 生物信息学马拉松授课(买一得五) ,你的生物信息学入门课
  • 时隔5年,我们的生信技能树VIP学徒继续招生啦
  • 2024的共享服务器交个朋友福利价仍然是800
  • 千呼万唤始出来的独享生物信息学云服务器
  • 永久免费的生信进阶培训(线下)

Comments are closed.