今天在《共享服务器第27个群》看到有粉丝提问,说他跑cibersort的时候,R代码运行超级慢,需要一些加速技巧。
本来呢,如果是十年前的我,一定会给他搜索然后使用这些包,并且测评它们,每个包都可以写一下文档。如下所示:
install.packages(c(
'foreach',
'iterators',
'doMC',
'doParallel',
'doSNOW'
))
不过,实际上,给出包的名字,其实就够了。
懂的都懂!自己安装它们,然后看一下readme即可。
生信基石之R语言
B站的10个小时教学视频务必看完,参考 GitHub 仓库存放的相关学习路线指导资料:https://github.com/jmzeng1314/R_bilibili ,可以参考一些优秀笔记,比如https://mubu.com/doc/2KUiSCfVsg
- 初级10 个题目:http://www.bio-info-trainee.com/3793.html
- 中级要求是:http://www.bio-info-trainee.com/3750.html
- 高级要求是完成20题: http://www.bio-info-trainee.com/3415.html
- 统计专题 30题:http://www.bio-info-trainee.com/4385.html
- 可视化专题30题:http://www.bio-info-trainee.com/4387.html
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习