前面我们在《单细胞天地》强推了:《单细胞基因组学前沿会议推荐》,因为疫情原因,单细胞基因组学前沿会议将会在线上举办,时间是:October 27-29, 2020 Virtual,官网:https://www.csh-asia.org/?content/404 。很多粉丝表明这样的会议只能是看“神仙打架”,学不到干货。那些演讲者当然很出名,汤富酬,张泽民的,但是他们分享的内容过于前沿和高精尖,不具备普适性。希望我们可以多分享一些干货,技术教程。恰好看到了英国剑桥大学这次暑期5天小课堂,虽然已经结束:22nd - 28th July 2020: Zoom virtual school, University of Cambridge,但是全部的资料都是共享出来的,跟我们之前分享的《华盛顿大学8天的生物信息学培训全部资料大放送》l类似,整理的非常!
暑期5天小课堂链接是:https://bioinformatics-core-shared-training.github.io/cruk-summer-school-2020/
让我们来一起看看这个课程设置吧!
参加课程需要的基础知识
一般来说,都是希望大家具备基础知识,这个课程主页也写的清清楚楚:
真的是再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
- 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
- 第5阶段:任务提交及批处理,脚本编写解放你的双手。
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。
没有这些基础知识,后面啥资料啥福利你都享用不了!!!
前两天是RNA-seq实战
传统的bulk RNA-seq实战,包括上游数据分析的Linux各种软件操作,和下游的R语言各种统计图表:
-
09:00 - 09:40; Welcome (Paul & Mark) & What is Functional Genomics? (Rory)
-
09:40 - 12:30; Data Processing for Next Generation Sequencing (Joanna & Shoko)
-
Lecture 1: Introduction to next generation sequencing
- Lecture 2: Quality control and trimming
- Practical 1: QC and quality trimming of raw sequencing reads
- Lecture 3: Short read alignment and Quality Control
- Practical 2: Short read alignment with STAR
-
12:30 - 13:30; LUNCH BREAK
-
13:30 - 17:00; Bulk RNAseq
-
Introduction to RNA-seq - Ash Sawle
- Quantification with SubRead
- RNA-seq Pre-processing
-
09:30 - 17:00; Bulk RNAseq
-
Introduction to RNAseq Analysis in R - Ash Sawle
-
Statistical Analysis of Bulk RNAseq Data
-
Experimental Design of Bulk RNAseq studies
13:00 - 14:00; LUNCH BREAK
- Differential Expression for RNA-seq
单细胞有完整的上下游解说
Single Cell RNAseq (Stephane, & Kasia)
配套代码:
- 09:30 - 17:00; Single Cell RNAseq (cont.) (Stephane & Zeynep)
- scRNA-seq - normalisation Rmd
- scRNA-seq - dimension reduction for visualisation Rmd
- scRNA-seq - detecting confounding factors Rmd
- scRNA-seq - feature selection Rmd
- scRNA-seq - batch correction Rmd
- scRNA-seq - dimensionality reduction for analysis Rmd
- scRNA-seq - clustering Rmd
- scRNA-seq - marker gene identification Rmd
- scRNA-seq - cell cycle assignment Rmd
- scRNA-seq - data set integration - PBMMC Rmd
- scRNA-seq - data set integration - whole Rmd
- scRNA-seq - diff exp between condition Rmd
- scRNA-seq - trajectory analysis - 1 Rmd
- scRNA-seq - trajectory analysis - 2 Rmd
- scRNA-seq - trajectory analysis - 3 Rmd
- scRNA-seq - doublet detection Rmd
第五天还有一些表观
很简单的一个上午介绍ChIP-seq data analysis
- Lecture 1: Introduction to ChIP-seq
- Lecture 2: Introduction to Peak Calling
- Practical 1: Peak calling with MACS2
- Lecture 3: Quality control methods for ChIP-seq
- Practical 2: QC & Integrative Genome Viewer
- Practical 3: Differential binding analysis: Diffbind
- Lecture 4: Downstream analysis of ChIP-seq
- Practical 4: Downstream analysis of ChIP-seq
实际上我在b站的74小时生信工程师教学视频合辑:
比他们的内容要丰富很多,完整入门生物信息学,起码需要13天,5天是完全不够的!
其它链接: