大量的NGS队列都是肿瘤研究领域,比如乳腺癌领域的复旦邵志敏团队TNBC队列,肺癌领域的吴一龙教授团队的队列,以及新加坡国家癌症中心的东亚肺腺癌(EAS LUAD)列队,动辄经费百万起步。
但是我一直在纳闷,为什么都是肿瘤学大佬呢,ngs组学也可以应用于其它疾病啊,心血管疾病,糖尿病啥的,最近搜文献无意中发现了一个类风湿关节炎,Rheumatoid Arthritis (RA) 的队列研究。
这个队列研究发表在Cell Rep. 2019 Aug ,文章题目是;《Molecular Portraits of Early Rheumatoid Arthritis Identify Clinical and Treatment Response Phenotypes》,队列全称是:Pathobiology of Early Arthritis Cohort (PEAC)。迅速浏览全文的时候,居然看到了一个3D的火山图,如下所示:
确实很有意思,火山图的本质并没有变化,这个时候竖着的不是Y轴,而且Z轴,但是竖着的仍然是P值的-log10转化形式,也就是说,在Z轴上面的基因统计学更显著。然后在2D火山图的X轴,在3D火山图里面变成了X、Y轴组成的平面,以前只需要表示一次差异分析场景的logFC,现在需要表示3次差异分析的logFC啦。
Lympho-myeloid, diffuse-myeloid, and pauci-immune fibroid vectors are mapped to 3 axes lympho-myeloid (L), diffuse-myeloid (M), and pauci-immune fibroid (F) using polar coordinates in the horizontal plane.
我觉得这个3D的火山图并不好
其实是3个分组,三次差异分析,理论上各自的差异分析分析结果可以两两比较,也就是3个比较而已,看logFC图,或者差异基因交集的韦恩图都没有问题。但是这个3D的火山图就很让人费解,虽然是作者也单独把X.Y轴的平面拿出来了,也能看得出来部分基因在哪两次差异分析里面达到了统计学显著。
虽然说这个3D的火山图我不喜欢,但是这篇文章仍然是有很多图表都可圈可点,建议大家花时间下载读一下,文章题目是:《Molecular Portraits of Early Rheumatoid Arthritis Identify Clinical and Treatment Response Phenotypes》
至于文章里面提到的差异分析,火山图,热图等标准流程,基本上读一下我在生信技能树的表达芯片的公共数据库挖掘系列推文 就明白了:
- 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版+R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
文末友情推荐
要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160 。
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班: - 数据挖掘学习班第4期(线上直播3周,马拉松式陪伴,带你入门)
- 生信爆款入门-第6期(线上直播4周,马拉松式陪伴,带你入门)
如果你没有服务器的话,做NGS数据分析实战可能会有点勉强,建议考虑:每天不足一块钱,定制生信云送给你