这一个图背后是12个差异分析的综合

我们的免费数据分析活动吸引了大量的粉丝, 这个春节我一个人就做了一百多个项目,很充实!如果你也需要免费的数据分析,直接看文末。

一个看似很复杂的项目

今天我们分享其中一个数据分析委托任务,粉丝来信是给我一个参考文献,想在LUSC里面重复下面这个LUAD结果。
image-20200216000307217
这个图对我来说很简单,但是我拒绝了, 因为我是免费分析数据,但是对方非常的不礼貌,给一个文献,然后就颐指气使的激将我,怀疑我的能力,具体来信内容我就不发出来了。
让我们看看这个看起来内容很充实的图到底有多简单吧!

首先拿到表达矩阵

同样的我们推荐是UCSC的XENA浏览器直接下载,这里可能是需要区分一下mRNA和lncRNA,然后根据表达量进行过滤。如下;
Among the LUAD datasets, expression data for 19,669 mRNAs, 7,309 lncRNAs, and 1,882 miRNAs were extracted from TCGA and analyzed with R package (DESeq2).

12次DESeq2差异分析

这里把LUAD病人分成了4类,是一个临床表型,就是stage啦,这样的话就是3*4=12个表达矩阵,12次差异分析。我们写代码其实就是一个循环罢了,可能就是这么多分析对计算资源时长消耗很严重。
In this analysis, we compared adjacent normal lung tissue with lung cancer subtypes defined by pathology stage (T1-T4), respectively.

最后绘制韦恩图

主要是选择好阈值,比如 FC < 2, FDR < 0.01就可以判断统计学显著的差异分子(mRNA和lncRNA,miRNA)啦
When we combined these four groups and analyzed for DE RNAs, 2,160 mRNAs (1,527 up- and 1,083 down-regulated), 915 lncRNAs(662 up- and 253 down-regulated), and 125 miRNAs (73 up- and 52 down-regulated) showed consistently differential expression (FC < 2, FDR < 0.01)

假如这个项目委托你

你会如何定价,假如你恰好有这样的需求,你愿意出多少钱呢?

免费的数据分析活动

我们推文里面提到的各种各样的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表,以及下面的目录的分析内容 对我来说是举手之劳,希望可以帮助到你!

Comments are closed.