前面我们在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,然后在生信菜鸟团分享了:中国大学MOOC的生物信息学之华中农业大学。
但是《中国大学MOOC》这个平台,大家不怎么主动去学习,反倒是B站成为了学习中心。最近就看到有人搬运了不少生物信息学相关视频课程在b站,所以我们继续这个《资源》推荐专辑:
今天带来的是:《面向生命科学的深度学习》
我一眼就看到了单细胞:
中英文字幕都有,练习听力也是极好的!
目录如下:
- Lecture 01 - Course Intro, AI, ML
- Lecture 02 - Machine Learning Foundations
- Lecture 03 - CNNs Convolutional Neural Networks
- Lecture 04 - RNNs, LSTMs, Transformers, GNNs
- Lecture 05 - Interpretable Deep Learning
- Lecture 6 - Generative Models, GANs, VAEs, Representation Learning
- Lecture 7 - Regulatory Genomics
- Lecture 8 - Regulator binding, Transcription Factors
- Lecture 09 - Gene Expression Prediction
- Lecture 10 -Single Cell Genomics
- Lecture 11 - Dimensionality Reduction
- Lecture 12 - Disease Circuitry Dissection GWAS
- Lecture 13 - GWAS mechanism
- Lecture 14 - Systems Genetics
- Lecture 15 - Graph Neural Networks
- Lecture 16 - AI for Drug Design
- Lecture 17 - Deep Learning for Protein Folding
- Lecture 19 - Machine Learning for Pathology
- Lecture 20 - Deep Learning for Cell Imaging Segmentation
- Lecture 21 - Deep Learning Image Registration and Analysis
- Lecture 22 - Electronic health records
- Lecture 23 - Deep Learning and Neuroscience
大家不要妄想听完这个课就学会了生物信息学
生物信息学是一个很大的概念,如果把它比作是奥运会,跳高跳远和跑步的就是完全不同的项目,而且仅仅是跑步就有长跑短跑跨栏多个项目。假如你要参加奥运会要先学会爬行,然后走路,接着跑步,再次是专业的训练比如腹式呼吸等等。同理,虽然说大家都是在做生物信息学,有人做的是蛋白质结构预测,有人做的是代谢组和蛋白质组学,而我们公众号教程里面通常说的生物信息学指的是基于ngs的各种ngs组学,甚至都不包括三代测序这样的小众方向。
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下:
- 了解常量和变量概念
- 加减乘除等运算(计算器)
- 多种数据类型(数值,字符,逻辑,因子)
- 多种数据结构(向量,矩阵,数组,数据框,列表)
- 文件读取和写出
- 简单统计可视化
- 无限量函数学习
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
- 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
- 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
- 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
- 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
- 第5阶段:任务提交及批处理,脚本编写解放你的双手。
- 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。
这样的课程, 比如:中国大学MOOC的生物信息学公开课之河南科技大学 ,以及:中国大学MOOC的生物信息学之华中农业大学,北京大学生物信息学:学习方法(完整带课件)(总计14个小时)。都不是直接对你的ngs组学技能负责的,就好比你如果是想参加奥运会的100米短跑,它这样的课程就是告诉你走路的基本原理,并不能直接决定你奥运会成绩,但是不知道走路的基本原理肯定是会在跑步的时候会知其然不知其所以然。
这样的课程,是给你打基础的,后续你仍然是需要主动加强R语言和Linux技能,学习后可以试试看我们的周末班全套练习题:
R语言的练习题
- 初级10 个题目,尽量根据参考代码理解及完成:http://www.bio-info-trainee.com/3793.html
- 中级要求是:http://www.bio-info-trainee.com/3750.html
- 高级要求是完成20题: http://www.bio-info-trainee.com/3415.html
- 统计专题 30题:http://www.bio-info-trainee.com/4385.html
- 可视化专题30题:http://www.bio-info-trainee.com/4387.html
LINUX的练习题:
- 最低要求是完成我的 linux 20题 http://www.bio-info-trainee.com/2900.html
- 其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书。
- fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html
- sam和bam格式文件的shell小练习 http://www.bio-info-trainee.com/3578.html
- VCF格式文件的shell小练习 http://www.bio-info-trainee.com/3577.html
然后就可以看我B站免费NGS数据处理视频课程,已经组建了微信交流群的有下面这些: