我们已经多次介绍过生存分析:
- 集思广益-生存分析可以随心所欲根据表达量分组吗
- 生存分析时间点问题
- 寻找生存分析的最佳基因表达分组阈值
- apply家族函数和for循环还是有区别的(批量生存分析出图bug)
- TCGA数据库生存分析的网页工具哪家强
而且使用TCGA数据库来看感兴趣基因的生存情况非常简单,一个网页工具即可,都无需R语言了。当然了,很多时候大家会下意识的回避TCGA数据库,原因你懂的!使用KMPLOT工具
这个时候大家往往会选择kmplot,就是我经常说的“流氓”工具啦,比如文章是:TRIB3 supports breast cancer stemness by suppressing FOXO1 degradation and enhancing SOX2 transcription. Nat Commun 2019 Dec 16;10(1):5720. PMID: 31844113 就使用kmplot来对他们感兴趣的基因 TRIB3 根据表达量把几个GSE数据集的病人进行分组后看生存差异。
方法是:
我在生信技能树写了太多的GEO数据库介绍了,所以你应该是毫无疑问能够下载这些数据集,并且拿到病人临床信息的。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ; - 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版+R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
KMplot网页工具的结果图
生存分析图如下,毫无疑问肯定是统计学显著的啦,不然也很难被放在paper里面,但是我对这个结果是持怀疑态度的!
这个结果很容易理解,就是Overall survival (d) and metastasis-free survival (e) were determined by Kaplan–Meier analyses, and significant differences were determined by the log-rank test.
因为我怀疑这个结果,所以给你的学徒作业就是检查这个数据分析,在TCGA数据库重复这个分析,并且也在KMPLOT完成这个分析,下载里面提到的GSE数据集,再继续进行生存分析!数据分析免费做
2019-2020的春节假期我们生信技能树推出一系列生物信息学数据分析免费做活动,先到先得哈,我们推文里面提到的数据分析环节都是我非常有经验的, 对我来说是举手之劳,希望可以帮助到你!
- 转录组数据分析的4个维度认识(数据分析继续免费哦) RNA-seq数据的2个分组差异分析,热图,PCA图,火山图等等
- 根据感兴趣基因看肝癌免疫微环境的T细胞亚群差异 条形图或者箱线图
- 查看感兴趣基因的甲基化水平和RNA表达水平(数据分析免费做)相关性 散点图或者箱线图
发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com
邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!