课程推荐-北京大学生物信息学

前面我们在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,然后在生信菜鸟团分享了:[中国大学MOOC的生物信息学之华中农业大学](https://mp.weixin.qq.com/s/XCdnGPVmDPYhhNLa_7bnUA)。

但是《中国大学MOOC》这个平台,大家不怎么主动去学习,反倒是B站成为了学习中心。最近就看到有人搬运了不少生物信息学相关视频课程在b站,所以我们继续这个《资源》推荐专辑:

今天带来的是【推荐课程】北京大学生物信息学:学习方法(完整带课件)(总计14个小时)

目录如下:

  • 1-1 什么是生物信息学
  • 1-2 生物信息学历史
  • 1-3 中国大陆的生物信息学
  • 2-1序列比对中的基本概念
  • 2-2 利用动态规划进行全局比对
  • 2-3 从全局比对到局部比对
  • 2-4 考虑仿射空位罚分的序列比对,以及如何计算Needleman-Wunsch算法的时间复杂度
  • 2-S1 关于同源、相似性、相似性矩阵和点阵图的补充材料
  • 3-1 序列数据库
  • 3-2 BLAST算法初探
  • 3-S1 学生课堂报告
  • 4-1 从状态到马尔可夫链
  • 4-2 隐马尔可夫模型
  • 4-3 用隐马尔可夫模型建立预测模型
  • 4-S1 学生课堂报告【1】
  • 4-S3 学生课堂报告【3】
  • 4-S4 学生实践
  • 5-1 新一代测序
  • 5-2 序列回帖和变异鉴定
  • 5-3 序列回帖和变异鉴定的分析演示
  • 5-S1 关于回帖、变异鉴定的补充材料
  • 5-S2 关于基因型鉴定的补充材料
  • 5-S3 Ion Torrent PGM测序介绍
  • 5-S4 3730 Sanger测序介绍
  • 5-S5 学生课堂报告
  • 6-1 问题概述
  • 6-2 记录变异的数据库
  • 6-3 基于保守性和规则的预测方法:SIFT和PolyPhen
  • 6-4 基于机器学习分类器的预测方法:SAPRED
  • 6-S1 支持向量机简介
  • 6-S2 学生课堂报告
  • 7-1 非编码RNA
  • 7-2 长非编码RNA的鉴定
  • 7-S1 变量选择
  • 8-1 转录组介绍
  • 8-2 RNA测序数据回贴与组装
  • 8-3 RNA-seq 数据分析
  • 8-4 转录组数据挖掘
  • 8-5 差异表达与聚类分析
  • 8-S1 illumina Hiseq & Miseq测序仪介绍
  • 8-S2 聚类分析
  • 8-S3 Maynard Olson教授访谈
  • 8-S4 学生课堂报告【1】
  • 8-S5 学生课堂报告【2】
  • 8-S6 学生课堂报告【3】
  • 8-S7 学生课堂报告【4】
  • 8-S8 学生实践
  • 8-S9 学生课堂报告
  • 9-1 本体论和基因本体论
  • 9-2 KEGG分子通路数据库
  • 9-3 GO注释
  • 9-4 分子通路鉴定
  • 9-5 应用:药物成瘾共同分子通路的鉴定
  • 9-S1 数据库系统简介
  • 9-S2 KOBAS演示
  • 9-S3 学生演示KOBAS
  • 10-1 生物信息资源概览
  • 10-2 美国国家生物信息中心(NCBI)资源
  • 10-3 欧洲生物信息中心(EBI)资源
  • 10-4 UCSC基因组浏览器
  • 10-5 其他主要生物信息资源
  • 10-S1 学生介绍CBI资源
  • 11-1 新基因鉴定及演化分析- 概念与实例
  • 11-2 新基因鉴定及演化分析- 大脑演化的驱动力
  • 11-3 一个与成瘾相关的人类特异的从头起源的新基因
  • 11-4 从非编码RNA起源的从头起源新基因
  • 11-S1 学生课堂报告
  • 12-1 从干实验到湿实验——一个演化问题 第1部分
  • 12-2 裴钢教授关于研究背景的介绍
  • 12-3 从干实验到湿实验——一个演化问题 第2部分
  • 12-S1 裴钢教授访谈
  • 12-S2 学生课堂报告

大家不要妄想听完这个课就学会了生物信息学

生物信息学是一个很大的概念,如果把它比作是奥运会,跳高跳远和跑步的就是完全不同的项目,而且仅仅是跑步就有长跑短跑跨栏多个项目。假如你要参加奥运会要先学会爬行,然后走路,接着跑步,再次是专业的训练比如腹式呼吸等等。同理,虽然说大家都是在做生物信息学,有人做的是蛋白质结构预测,有人做的是代谢组和蛋白质组学,而我们公众号教程里面通常说的生物信息学指的是基于ngs的各种ngs组学,甚至都不包括三代测序这样的小众方向。

再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手。
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。

这样的课程, 比如:中国大学MOOC的生物信息学公开课之河南科技大学 ,以及:中国大学MOOC的生物信息学之华中农业大学,北京大学生物信息学:学习方法(完整带课件)(总计14个小时)。都不是直接对你的ngs组学技能负责的,就好比你如果是想参加奥运会的100米短跑,它这样的课程就是告诉你走路的基本原理,并不能直接决定你奥运会成绩,但是不知道走路的基本原理肯定是会在跑步的时候会知其然不知其所以然。

这样的课程,是给你打基础的,后续你仍然是需要主动加强R语言和Linux技能,学习后可以试试看我们的周末班全套练习题:

R语言的练习题
LINUX的练习题:

然后就可以看我B站免费NGS数据处理视频课程,已经组建了微信交流群的有下面这些:

Comments are closed.