正在发愁今天公众号写什么,电脑挂机的微信就看到了素未谋面的“学徒”负责的公众号《 医学生之学习生信 》跳出来了组学系列教程,好奇之下就点进去想看看他们更新到哪里了,一看吓一跳!
临床医生真不容易
前面拼了老命掌握了R,现在又开始弄python,见:影像组学 | 12.pyradiomics包安装,安装R包的痛苦又要在python包里面重演一遍吗?我看到了 pyradiomics安装途径,就有下面的几个方式:
- 通过pip安装(个人推荐)
- 通过conda安装
- 从源代码安装
- 使用3D Slicer Radiomics扩展
- 使用pyradiomics Docker
- 设置Docker
更多影像组学数据分析技巧,欢迎大家去follow我那个素未谋面的“学徒”负责的公众号《 医学生之学习生信 》。
我看了看,基本上都是机器学习的一些造好的轮子的使用, 我记得2019年生信菜鸟团的 鲍志炜专栏也有类似的教程:
- #开新坑#一起来学习机器学习吧~
- 机器学习实战-k-邻近算法
- 机器学习实战-决策树
- 机器学习实战-朴素贝叶斯
- 机器学习实战-逻辑回归
- 机器学习实战-支持向量机(一)
- 机器学习实战-支持向量机·sklearn参数详解
- 机器学习实战-Adaboost
- 机器学习实战-数据预处理
- 机器学习实战-机器学习性能指标
- 机器学习实战-特征选择
- 机器学习实战-分类算法学习目录
- bioBakeryWorkflows-宏基因组分析流程
关于机器学习,在生物信息学领域可能仍然是R语言应用更为广泛,简单的一个R包或者函数即可。在肿瘤数据库挖掘里面,主要是生存模型构建最广泛。我的4个小时TCGA肿瘤数据库知识图谱视频教程,中共使用了四种算法构建模型的R语言实践版本:
- cox(可做单因素和多因素)
TCGA的cox模型构建和风险森林图 - lasso回归
用lasso回归构建生存模型+ROC曲线绘制 - 随机森林
听起来很霸气用起来并不难的随机森林 - 支持向量机
听起来很霸气用起来并不难的 支持向量机
不管用了那种算法,核心都只是几句代码而已。不管是R语言还是python语言,都不会有太大的区别。