前面我们在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,然后在生信菜鸟团分享了:中国大学MOOC的生物信息学之华中农业大学。
但是《中国大学MOOC》这个平台,大家不怎么主动去学习,反倒是B站成为了学习中心。最近就看到有人搬运了不少生物信息学相关视频课程在b站,所以我们继续这个《资源》推荐专辑:
今天带来的是 《生物信息学》-薛宇-华中科技大学-推荐课程 (总计30个小时)
被上传到了b站,目录如下:
- 第一章 历史简介和概论-第1节课
- 第一章 历史简介和概论-第2节课
- 第一章 历史简介和概论-第3节课
- 第二章 生物序列数据获取和检索-第4节课
- 第二章 生物序列数据获取和检索-第5节课
- 第二章 生物序列数据获取和检索-第6节课
- 补充章节 PERL编程-第7节课
- 补充章节 PERL编程-第8节课
- 第三章 序列分析的数学基础-第9节课
- 第三章 序列分析的数学基础-第10节课
- 第三章 序列分析的数学基础-第11节课
- 第四章 双序列比对-第12节课
- 第四章 双序列比对-第13节课
- 第四章 双序列比对-第14节课
- 第四章 双序列比对-第15节课
- 第四章 双序列比对-第16节课
- 第五章 多序列比对-第17节课
- 第五章 多序列比对-第18节课
- 第六章 序列模式识别-第19节课
- 第六章 序列模式识别-第20节课
- 第六章 序列模式识别-第21节课
- 第六章 序列模式识别-第22节课
- 第六章 序列模式识别-第23节课
- 第七章 分子进化与系统发育分析-第24节课
- 第七章 分子进化与系统发育分析-第25节课
- 第七章 分子进化与系统发育分析-第26节课
- 第七章 分子进化与系统发育分析-第27节课
- 第八章 基因组分析-第28节课
- 第八章 基因组分析-第29节课
- 第八章 基因组分析-第30节课
- 第九章 测序读段回贴-第31节课
- 第九章 测序读段回贴-第32节课
- 第十章 基因组组装-第33节课
- 第十章 基因组组装-第34节课
- 第十一章 转录组与转录调控分析-第35节课
- 第十一章 转录组与转录调控分析-第36节课
- 第十一章 转录组与转录调控分析-第37节课
- 第十一章 转录组与转录调控分析-第38节课
大家不要妄想听完这个课就学会了生物信息学
生物信息学是一个很大的概念,如果把它比作是奥运会,跳高跳远和跑步的就是完全不同的项目,而且仅仅是跑步就有长跑短跑跨栏多个项目。假如你要参加奥运会要先学会爬行,然后走路,接着跑步,再次是专业的训练比如腹式呼吸等等。同理,虽然说大家都是在做生物信息学,有人做的是蛋白质结构预测,有人做的是代谢组和蛋白质组学,而我们公众号教程里面通常说的生物信息学指的是基于ngs的各种ngs组学,甚至都不包括三代测序这样的小众方向。
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
- 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
- 第5阶段:任务提交及批处理,脚本编写解放你的双手。
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。
这样的课程, 比如:中国大学MOOC的生物信息学公开课之河南科技大学 ,以及:中国大学MOOC的生物信息学之华中农业大学,北京大学生物信息学:学习方法(完整带课件)(总计14个小时)。都不是直接对你的ngs组学技能负责的,就好比你如果是想参加奥运会的100米短跑,它这样的课程就是告诉你走路的基本原理,并不能直接决定你奥运会成绩,但是不知道走路的基本原理肯定是会在跑步的时候会知其然不知其所以然。
这样的课程,是给你打基础的,后续你仍然是需要主动加强R语言和Linux技能,学习后可以试试看我们的周末班全套练习题:
R语言的练习题
- 初级10 个题目,尽量根据参考代码理解及完成:http://www.bio-info-trainee.com/3793.html
- 中级要求是:http://www.bio-info-trainee.com/3750.html
- 高级要求是完成20题: http://www.bio-info-trainee.com/3415.html
- 统计专题 30题:http://www.bio-info-trainee.com/4385.html
- 可视化专题30题:http://www.bio-info-trainee.com/4387.html
LINUX的练习题:
- 最低要求是完成我的 linux 20题 http://www.bio-info-trainee.com/2900.html
- 其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书。
- fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html
- sam和bam格式文件的shell小练习 http://www.bio-info-trainee.com/3578.html
- VCF格式文件的shell小练习 http://www.bio-info-trainee.com/3577.html
然后就可以看我B站免费NGS数据处理视频课程,已经组建了微信交流群的有下面这些: