可视化是一门很深的学问,详解:https://mubu.com/doc/3L0wkgGUVg 这里仅仅是出题30个,引导大家进入该领域!
这里仅仅是针对一个数据集,就是r包airway并且通过assay函数拿到其表达矩阵。
关于 airway 代码如下,需要理解:
options(stringsAsFactors = F)
library(airway)
data(airway)
# 这里需要自行学习bioconductor里面的RangedSummarizedExperiment对象
airway
RNAseq_expr=assay(airway)
colnames(RNAseq_expr)
RNAseq_expr[1:4,1:4]
# RNAseq_expr 是一个数值型矩阵,属于连续性变量,可以探索众数、分位数和平均数 ,极差,方差和标准差等统计学指标
RNAseq_gl=colData(airway)[,3]
table(RNAseq_gl)
是 8个样本的RNA-seq数据的counts矩阵,这8个样本分成2组,每组是4个样本, 分别是 trt 和 untrt 组。
通过上面的代码,我们得到了对airway数据集的RNA-seq数据的counts矩阵,命名为 RNAseq_expr 下面会用得到。
基础绘图
Q1: 对RNAseq_expr的每一列绘制boxplot图
Q2: 对RNAseq_expr的每一列绘制density图
Q3: 对RNAseq_expr的每一列绘制条形图
Q4: 对RNAseq_expr的每一列取log2后重新绘制boxplot图,density图和条形图
Q5: 对Q4的3个图里面添加 trt 和 untrt 组颜色区分开来
Q6: 对RNAseq_expr的前两列画散点图并且计算线性回归方程
Q7: 对RNAseq_expr的所有列两两之间计算相关系数,并且热图可视化。
Q8: 取RNAseq_expr第一行表达量绘制折线图
Q9: 取RNAseq_expr表达量最高的10个基因的行绘制多行折线图
Q10: 一行行的运行 https://github.com/jmzeng1314/5years/blob/master/learn-R/tasks/2-chunjuan-600.R 代码
ggplot绘图
Q1-9:使用ggplot代码重写上面基础绘图的Q1-9习题
Q10: 一行行的运行:http://biotrainee.com/jmzeng/markdown/ggplot-in-R.html 代码
生物信息学绘图
需要参考 https://github.com/jmzeng1314/GEO/blob/master/airway_RNAseq/DEG_rnsseq.R