看到我们生信技能树的教学群有学员提问这样的图如何绘制:
其实我们讲解过,绘图代码本身搜索即可拿到,关键词 ggpubr paired boxplot
,输入到 https://cn.bing.com/?ensearch=1 即可,如下:
第一个链接里面就有完整的代码:
- https://rpkgs.datanovia.com/ggpubr/reference/ggpaired.html
如下:
我们需要做的就是获取这样的数据,然后复制粘贴示例代码即可。
那么问题来了,数据如何获取呢? - 从ucsc的xena浏览器里面下载感兴趣癌症,比如肝癌的表达矩阵(counts值)
- 然后根据样本名字拿到有配对的几十个病人的癌症和正常对照数据(部分癌症数据并没有对照)
- 接着提取感兴趣基因(比如TP53)的表达量
- 最后套用上面的绘图代码即可!
那就随便把它布置成为一个学徒作业吧,TP53在TCGA的肝癌的有配对样本病人的转录组数据表达量配对图!
好了,公开课继续,我们会邀请优秀学徒在钉钉群演示这个图如何绘制哈!
钉钉群号码是:一个简单易学生物信息学速成指南,赶紧收藏!仍然是推荐大家学好基础编程
计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
- 《生信分析人员如何系统入门R(2019更新版)》
- 《生信分析人员如何系统入门Linux(2019更新版)》
把R的知识点路线图搞定,如下: - 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习: - 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量
- 第5阶段:任务提交及批处理,脚本编写解放你的双手
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我