因为最近自己购置了一个全新的Windows电脑,所以就系统性的配置了全部的生物信息学相关软件,当然是也包括R语言啦,毕竟我一直强调生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
很轻松就可以在 https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 看到最新版R语言,安装它后,再配套rstudio打开即可:
R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R是自由软件,不带任何担保。
在某些条件下你可以将其自由散布。
用'license()'或'licence()'来看散布的详细条件。
R是个合作计划,有许多人为之做出了贡献.
用'contributors()'来看合作者的详细情况
用'citation()'会告诉你如何在出版物中正确地引用R或R程序包。
用'demo()'来看一些示范程序,用'help()'来阅读在线帮助文件,或
用'help.start()'通过HTML浏览器来看帮助文件。
用'q()'退出R.
> names(installed.packages()[,1])
[1] "base" "boot" "class" "cluster"
[5] "codetools" "compiler" "datasets" "foreign"
[9] "graphics" "grDevices" "grid" "KernSmooth"
[13] "lattice" "MASS" "Matrix" "methods"
[17] "mgcv" "nlme" "nnet" "parallel"
[21] "rpart" "spatial" "splines" "stats"
[25] "stats4" "survival" "tcltk" "tools"
[29] "translations" "utils"
>
这个版本号很有意思,〈Taking Off 〉是由Taka、Dan Lancaster、Nick Long作词作曲,乐队ONE OK ROCK演唱的一首英文歌曲。
中文解释居然是:起跳,开始 ;
不过更让我惊奇的是它内置的R包,稍微有点多啊!我记得很久以前看的R书籍都写着内置R包都是7个!这个是为什么呢?
百度百科关于软件版本的解释
软件版本编号订定是指为软件设置版本号码的方式。通常,版本号码会以数字订定,但亦有不同的方式。
软件名称后面经常有一些英文和数字,如:QQ 2007 Beta,这些都是软件的版本标志,通过它,我们可以对软件的类型有所了解。
版本控制比较普遍的 3 种命名格式 :
- GNU 风格的版本号命名格式
- Windows 风格的版本号命名格式
- .Net Framework 风格的版本号命名格式。
主要是 主版本号 . 子版本号 [ 修正版本号 [. 编译版本号 ]]
可以在 https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 看到R的大版本变化:
其中大部分人接触比较多的应该是3版本:
File Name ↓ File Size ↓ Date ↓
Parent directory/ - -
R-3.0.0.tar.gz 24.3 MiB 2013-04-03 15:10
R-3.0.1.tar.gz 24.3 MiB 2013-05-16 15:11
R-3.0.2.tar.gz 24.2 MiB 2013-09-25 15:11
R-3.0.3.tar.gz 26.8 MiB 2014-03-06 16:12
R-3.1.0.tar.gz 27.2 MiB 2014-04-10 15:11
R-3.1.1.tar.gz 27.3 MiB 2014-07-10 15:11
R-3.1.2.tar.gz 27.3 MiB 2014-10-31 16:11
R-3.1.3.tar.gz 27.6 MiB 2015-03-09 16:12
R-3.2.0.tar.gz 27.8 MiB 2015-04-16 15:13
R-3.2.1.tar.gz 27.8 MiB 2015-06-18 15:13
R-3.2.2.tar.gz 28.4 MiB 2015-08-14 15:12
R-3.2.3.tar.gz 28.4 MiB 2015-12-10 16:13
R-3.2.4-revised.tar.gz 28.5 MiB 2016-03-17 02:46
R-3.2.4.tar.gz 28.5 MiB 2016-03-10 16:13
R-3.2.5.tar.gz 28.5 MiB 2016-04-15 00:01
R-3.3.0.tar.gz 28.4 MiB 2016-05-03 15:13
R-3.3.1.tar.gz 28.5 MiB 2016-06-21 15:21
R-3.3.2.tar.gz 28.1 MiB 2016-10-31 16:13
R-3.3.3.tar.gz 28.4 MiB 2017-03-06 16:16
R-3.4.0.tar.gz 28.8 MiB 2017-04-21 15:14
R-3.4.1.tar.gz 28.8 MiB 2017-06-30 15:04
R-3.4.2.tar.gz 28.9 MiB 2017-09-28 15:04
R-3.4.3.tar.gz 28.8 MiB 2017-11-30 16:05
R-3.4.4.tar.gz 29.1 MiB 2018-03-15 16:04
R-3.5.0.tar.gz 29.3 MiB 2018-04-23 15:04
R-3.5.1.tar.gz 28.4 MiB 2018-07-02 15:04
R-3.5.2.tar.gz 28.8 MiB 2018-12-20 16:04
R-3.5.3.tar.gz 28.8 MiB 2019-03-11 16:04
R-3.6.0.tar.gz 29.0 MiB 2019-04-26 15:05
R-3.6.1.tar.gz 29.1 MiB 2019-07-05 15:05
R-3.6.2.tar.gz 31.8 MiB 2019-12-12 16:05
R-3.6.3.tar.gz 31.8 MiB 2020-02-29 16:05
居然是从2013年到2020年,也就是说绝大部分接触R语言的我们,都是在R3时代,不知道接下来的R4时代,我们好有什么变化?
文末友情推荐
要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160 。
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班:
- 数据挖掘学习班第5期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。
- 生信爆款入门-第7期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。
如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?
号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!另外:绝大部分生信技能树粉丝都没有机会加我微信,已经多次满了5000好友,所以我开通了一个微信好友,前100名添加我,仅需150元即可,3折优惠期机会不容错过哈。我的微信小号二维码在:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》