静待花开

最近在朋友圈看到了一幅漫画:等一朵花开需要很多耐心和微笑:

小林漫画

挺有意思的,而且是各个地区中小学生话题作文的题目来源,让我回忆起来了九年义务教育被作文支配的恐惧。

此次省略800字。。。

完结。。。。

其实学生物信息学也是如此,不能急于求成, 还是得坚持长期主义,也不能投机取巧,弄三两个网页工具就沾沾自喜,也不可能忽略基础直接学高阶技能。

因为单细胞技术的流行,现在的很多小伙伴初次接触生物信息学数据分析是从单细胞转录组数据开始的,所以大家可能会喜欢单刀直入,要么是问需要多久学会单细胞要么是问单细胞该如何学。这个时候我喜欢让提问者在学单细胞转录组之前,先了解一下单细胞和转录组各自的分析思路!

首先需要一定量的R语言编程基础知识

再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

一定要自己购买5本以上的R语言书籍,而且保证每个书都看五遍以上!

然后了解表达量矩阵数据分析常见图表

所谓的表达量矩阵数据分析常见图表,其实就是走差异分析,火山图,热图等等标准流程,基本上读一下我在生信技能树的表达芯片的公共数据库挖掘系列推文就明白了;

然后理解转录组数据分析(充分的实战)

如果大家对数据挖掘的中间过程的合理性不好把握,建议看完我两年前带学徒的时候,安排他们做的文献关键图表复现作业系列笔记分享,如下:

第一期(2018年秋季)

第二期(2019年全年)

接着理解单细胞降维聚类分群

其中不一定要10X单细胞转录组数据表达量矩阵才能供你练习,cytof这样的质谱流式也是可以做单细胞降维聚类分群,比如《生信技能树》发布的系列文字版教程:

最后才是单细胞数据分析本身

如果你没有单细胞转录组认知,需要先看看基础10讲:

最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释

Comments are closed.