集思广益-生存分析可以随心所欲根据表达量分组吗

很久以前我们提到过TCGA的各种网页数据库的生存分析结果冲突的问题,现在又有人提出来一个新的问题,如下:

根据基因表达量的中位值把样本分成高低表达量的组别,然后做差异分析是比较符合大家的直觉的。
如果这个时候生存分析结果不具有统计学显著性,而大家又的确感兴趣这个基因在这个癌症的临床意义,会尝试调整分组指标,这也就是为什么网页工具会提供调整阈值的窗口,比如调整为如下所示:

你会惊奇的发现,显著了!!!
但是实际上这样30%的阈值来进行分组的操作一定会受到审稿人质疑,基本上没有人这样操作,如果调整我25%的阈值就会发现马上又不显著了。
所以这样的KM分析是有弊端的!

那COX分析呢

COX分析就是排除一下样本其它信息干扰之后的生存分析,这个时候网页工具能做的很有限,我们需要下载临床数据在R里面完成这个分析,如果你看了我的视频,就应该是知道至少下面两个临床信息是值得信赖的。

Comments are closed.