我特别喜欢生信菜鸟团专栏作者的模式,可以让我学到很多知识,我一直强调一个人的力量实在是有限的,哪怕是我这样有着非凡天赋以及远超常人的毅力,也只能是在过去的五年里完成1.3万篇教程,涵盖生物信息学的176个分析要点。但是生物信息学受生物学拖累,这个21世纪的学科,即使我如此努力,仍然是完成了不到1%的知识整理,如果没有团队, 我们的生信技能树计划估计在我有生之年是看不到完成的希望了。
除了昨天生信菜鸟团专栏周四作者(大吉/大力土豆)的2019 提到的circRNA和python是我的短板之外,其实还有微生物和机器学习我涉及的很少,同样的也是有菜鸟团专栏作者为我补充:
微生物
- phyloseq-用R分析微生物组数据及可视化(一)
- phyloseq-用R分析微生物组数据及可视化(二)
- phyloseq-用R分析微生物组数据及可视化(三)
- 宏基因组笔记-统计学方法(一)
- 宏基因组分析流程MOCAT2教程
- 分析带UMI分子标签的测序数据
- Anvi’o宏基因组分析流程快速指南
- GMrepo-人类肠道微生物菌群数据库
- 综述-微生物组学的建模方法(上)
- 综述-微生物组学的建模方法(下)
- 如何鉴定肠型
- BioGrakn:利用Grakn知识图谱加速生物医学知识的发现
- PICRUSt2使用指南
- 利用宏基因组数据估计细菌生长速率
技巧
- 使用百度API批量翻译
- WDL学习笔记
- 使用bcl2fastq将basecall文件转换成fastq文件
- 我的Docker笔记
- 天河二号极简指南
- 我最常用的10个JupyterNotebook插件
- 必学R包之biomaRt
- 我的Shiny入门学习笔记
- FASTP-极速全能的FASTQ预处理神器
- #Awesome!!#神奇的单行命令
- Bpipe-教你轻松搭建分析流程
- 一个R包带你挖掘宏基因组公共数据库
机器学习
- #开新坑#一起来学习机器学习吧~
- 机器学习实战-k-邻近算法
- 机器学习实战-决策树
- 机器学习实战-朴素贝叶斯
- 机器学习实战-逻辑回归
- 机器学习实战-支持向量机(一)
- 机器学习实战-支持向量机·sklearn参数详解
- 机器学习实战-Adaboost
- 机器学习实战-数据预处理
- 机器学习实战-机器学习性能指标
- 机器学习实战-特征选择
- 机器学习实战-分类算法学习目录
- bioBakeryWorkflows-宏基因组分析流程
关于机器学习,在生物信息学领域可能仍然是R语言应用更为广泛,简单的一个R包或者函数即可。在肿瘤数据库挖掘里面,主要是生存模型构建最广泛。
我的4个小时TCGA肿瘤数据库知识图谱视频教程,中共使用了四种算法构建模型:
- cox(可做单因素和多因素)
TCGA的cox模型构建和风险森林图 - lasso回归
用lasso回归构建生存模型+ROC曲线绘制 - 随机森林
听起来很霸气用起来并不难的随机森林 - 支持向量机
听起来很霸气用起来并不难的 支持向量机
不管用了那种算法,核心都只是几句代码而已。
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
- 全国巡讲全球听(买一得五),第二期 ,你的生物信息学入门课
- 生信技能树的2019年终总结 ,你的生物信息学成长宝藏
- 2020学习主旋律,B站74小时免费教学视频为你领路