其实公共数据库挖掘仅仅是你科研课题的前戏,避免你重复浪费科研经费去做一些明明可以通过分析公共数据库拿到的结论。
比如你研究的癌症里面哪些基因高表达,哪些低表达,你通过数据挖掘拿到了感兴趣基因,后续自己设计基础实验来探索它们,完善你的生物学故事。假如你并不知道可以分析公共数据库,那么你就不得不自己去做一次癌症病人队列的转录组,耗费几万块钱来拿到一个本来就可以通过公共数据库分析拿到的上下调基因。
或者说,你已经有了比较完整的生物学故事,定位到了具体的通路或者基因,如果想设计病人队列来说明你感兴趣的基因或者通路的临床意义,就是一个大工程,从病人招募信息整理,到ngs组学数据采集,分析,统计可视化等等。但是大概率上你感兴趣的疾病都会有现成的公共数据,你完全可以选择从你感兴趣的角度来对它进行分析!
所以我安排比较有空的学徒做了一系列的文献图表复现,也断断续续坚持了两年,现在整理出来共享给大家。
第一期(2018年秋季)
- 保姆式GEO数据挖掘演示—重现9分文章
- GEO数据挖掘-第一期-胶质母细胞瘤(GBM)
- GEO数据挖掘-第二期-三阴性乳腺癌(TNBC)
- GEO数据挖掘-第三期-口腔鳞状细胞癌(OSCC),WGCNA
- GEO数据挖掘-第四期-肝细胞癌(HCC),WGCNA
- GEO数据挖掘-第五期-肝细胞癌(HCC)-多组分开差异分析
- GEO数据挖掘-第六期-RNA-seq数据也照挖不误
- TCGA数据库的TP53突变型和TP53野生型BRCA病人的差异分析结果
- GEO数据库的耐药与敏感的患者组织内的成纤维细胞比较
- TCGA数据库中三阴性乳腺癌在亚洲人群中的差异表达
- TCGA数据库的有PIK3CA基因突变的肿瘤病人的转录水平变化
- TCGA数据库里面的乳腺癌的芯片表达数据进行差异分析
第二期(2019年全年)
- 1. 公共数据辅助乳腺癌的免疫治疗机制研究
- 2. 有生物学意义的复杂热图
- 3. 干扰MYC‑WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分 析
- 4. 按基因在染色体上的顺序画差异甲基化热图
- 5. 热图、⻙恩图、GO富集分析图(有了转录组数据不知道该怎么写⽂ 章,看我就对了!)
- 6. 纯R代码实现ssGSEA算法评估肿瘤免疫浸润程度
- 7. 肿瘤异质性+免疫浸润细胞数据挖掘(可能是最简单的3分⽂章了)
- 8. ArrayExpress数据库的基因芯⽚原始数据处理,3D主成分图及聚类热 图
- 9. 学徒数据挖掘第⼆期汇总之多分组基因注释代码⼤放送
- 10. TCGA数据辅助甲基化区域的功能研究
- 11. 你确定你的差异基因找对了吗?
- 12. 看nature⽂章是如何设计和使⽤普通转录组数据
- 13. 不⼀定正确的多分组差异分析结果热图展现
- 14. 如果传统bulk转录组数据队列⾜够⼤也可以使⽤单细胞流程
- 15. 最简单的芯⽚挖掘也会出错(菜⻦团周⼀数据挖掘专栏第?期)
- 16. 乳腺癌的IHC分类和PAM50分型的差异情况
目前仅提供第一期13个教程数据代码打包
全部代码和数据,存放在微云供下载,内容截图如下:
需要注意的是,学徒早就出师了我还委托她整理,所以这个代码是需要付费的。第二期由不同学徒完成,代码数据我还得组织大家重新整理,敬请期待哈!
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
- 底裤价转录组产品线(还送数据分析培训)(八九百一个样品)
- 三维基因组学分析实战培训班,线上直播课,2天仅需399(生信技能树粉丝特权价格)
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路
付费内容分割线
为有效杜绝黑粉跟我扯皮,设置一个付费分割线,这样它们就没办法复制粘贴我的代码,也不可能给我留言骂街了!(付费6元,拿到测试数据和代码)
世界顿时清净很多!
综合脚本
链接在:链接:https://share.weiyun.com/5O0FuTW
这个微云链接需要密码,付费6元可以得到,请移步到微信公众号:https://mp.weixin.qq.com/s/v-RMh3HKMT_mfIhyS91d_g 付费获取哈!