我们的免费数据分析活动吸引了大量的粉丝, 这个春节我一个人就做了一百多个项目,很充实!如果你也需要免费的数据分析,直接看文末。
一个看似很复杂的项目
今天我们分享其中一个数据分析委托任务,粉丝来信是给我一个参考文献,想在LUSC里面重复下面这个LUAD结果。
这个图对我来说很简单,但是我拒绝了, 因为我是免费分析数据,但是对方非常的不礼貌,给一个文献,然后就颐指气使的激将我,怀疑我的能力,具体来信内容我就不发出来了。
让我们看看这个看起来内容很充实的图到底有多简单吧!
首先拿到表达矩阵
同样的我们推荐是UCSC的XENA浏览器直接下载,这里可能是需要区分一下mRNA和lncRNA,然后根据表达量进行过滤。如下;
Among the LUAD datasets, expression data for 19,669 mRNAs, 7,309 lncRNAs, and 1,882 miRNAs were extracted from TCGA and analyzed with R package (DESeq2).
12次DESeq2差异分析
这里把LUAD病人分成了4类,是一个临床表型,就是stage啦,这样的话就是3*4=12个表达矩阵,12次差异分析。我们写代码其实就是一个循环罢了,可能就是这么多分析对计算资源时长消耗很严重。
In this analysis, we compared adjacent normal lung tissue with lung cancer subtypes defined by pathology stage (T1-T4), respectively.
最后绘制韦恩图
主要是选择好阈值,比如 FC < 2, FDR < 0.01就可以判断统计学显著的差异分子(mRNA和lncRNA,miRNA)啦
When we combined these four groups and analyzed for DE RNAs, 2,160 mRNAs (1,527 up- and 1,083 down-regulated), 915 lncRNAs(662 up- and 253 down-regulated), and 125 miRNAs (73 up- and 52 down-regulated) showed consistently differential expression (FC < 2, FDR < 0.01)
假如这个项目委托你
你会如何定价,假如你恰好有这样的需求,你愿意出多少钱呢?
免费的数据分析活动
我们推文里面提到的各种各样的数据分析环节都是我非常有经验的,比如我在lncRNA的一些基础知识 ,和lncRNA芯片的一般分析流程 介绍过的那些图表,以及下面的目录的分析内容 对我来说是举手之劳,希望可以帮助到你!
- 转录组数据分析的4个维度认识(数据分析继续免费哦) RNA-seq数据的2个分组差异分析,热图,PCA图,火山图等等
- 根据感兴趣基因看肝癌免疫微环境的T细胞亚群差异 条形图或者箱线图
- 查看感兴趣基因的甲基化水平和RNA表达水平(数据分析免费做)相关性 散点图或者箱线图
- 我不相信kmplot这个网页工具的结果(生存分析免费做)
- 单基因GSEA分析策略(数据分析免费做活动继续)
- 干扰一个基因然后分析全局基因表达其实是无法定位该基因完整功能(春节免费数据分析活动继续)
- log与否会改变rpkm形式表达矩阵top的mad基因列表 WGCNA分析免费做
- 甲基化信号值的差异分析也许不应该是看logFC 甲基化信号矩阵差异分析免费做
- WGCNA得到模块之后如何筛选模块里面的hub基因 WGCNA分析免费做
- 既然可以看感兴趣基因的生存情况,当然就可以批量做完全部基因的生存分析
还是老规矩,发送数据分析要求,以及简短的项目描述到我的邮箱 jmzeng1314@163.com 目前只接受邮件这个交流形式,谢谢合作,麻烦用心一点写!
邮件正文最好是加上你是啥时候认识生信技能树的哦,或者其它一些寒暄的话,自我介绍也行。主要是考虑到可能想免费分析数据的朋友很多,所以会根据你的来信,我主观判定一个优先级哦。目前我有20多个愿意长期在我的指导下进行数据探索的学徒,等我的团队扩大到200人,我们应该是可以做到数据分析全部免费,敬请期待哈!其它学徒作业
学徒不仅仅是在我这里学生物信息学相关知识,更重要的是能够筛选极少部分同样热爱知识整理和分享的小伙伴,所以我继续安排了一些学徒作业题:
- 学徒考核-计算wes数据的全部外显子的平均测序深度
- 为什么癌症病人据肿瘤单细胞水平的异质性但是细胞系没
- RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析
- GSE83521/GSE89143数据集-需去除批次效应
- GSVA或者GSEA各种算法都是可以自定义基因集的
- limma和edgeR对RNA-seq表达矩阵差异分析的区别
- 肿瘤外显子视频课程小作业
- 为什么不用TCGA数据库来看感兴趣基因的生存情况
如果看到这些习题的你也感兴趣加入我们的在线学徒列表,欢迎随机挑选一个作业尝试完成后,邮件汇报给我你探索的过程!我的邮箱 jmzeng1314@163.com这个甲基化数据分析不免费了
因为分析起来的确很耗费计算机资源了
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
- 全国巡讲全球听(买一得五) ,你的生物信息学入门课
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路