25

这是一个违背祖宗的决定

最近看到朋友圈转发的一大批“神医”做出违背祖宗的决定!

腾讯视频链接:https://v.qq.com/x/page/x3230xgj0x6.html

让我动容,敬佩之外我也想效仿一二,把我“祖传的”生物信息学技能公之于众,敞开门让大家学!我已经把这些技能录制成为了视频,并且在B站免费发布,已经组建了微信交流群的有下面这些:

当然了,如果你直接上手这些NGS组学数据分析实战有困难,说明你的Linux基础或者R语言不过关,也可以看c超级基础的内容:

image-20210303182603072

再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手。
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。

文末友情推荐

25

seq-ImmuCC实战推断小鼠的肿瘤免疫微环境

前面我在《生信菜鸟团》公众号介绍了 小鼠的肿瘤免疫微环境推断可以用seq-ImmuCC,本来是想布置作业让大家下载https://www.ncbi.nlm.nih.gov/bioproject/PRJNA489661/ 的数据,自己走一波seq-ImmuCC实战。
但是发现这个并不是《生信技能树》公众号,所以我没办法布置练习题额,所以现在在《生信技能树》公众号再来一次哈!前面的例子:人人都能学会的单细胞聚类分群注释 ,第一次分群就非常漂亮!可以看到这个数据集GSE129516里面的6个样品都是有不同的免疫细胞亚群的,而且既然已经是有了降维聚类分群结果,就可以算出各个细胞亚群的比例啦!
我们的作业是,把GSE129516里面的6个样品的单细胞表达量矩阵简单的累加成为一个假的bulk表达量矩阵, 然后拿这个表达量矩阵去进行seq-ImmuCC实战,推断小鼠的肿瘤免疫微环境,就是各个免疫细胞比例。然后跟单细胞的真实免疫细胞各个亚群比例进行对比,测试一下seq-ImmuCC这个网页工具的表现情况!

关于seq-ImmuCC开发者

苏州系统医学研究所苏吴爱平教授和秦晓峰教授合作,发布了一个基于转录组测序(RNA-Seq)数据对小鼠组织中10种主要免疫细胞组分进行预测的计算模型(seq-ImmuCC),将为测序数据提供免疫细胞层面的解读视角。相关研究以“seq-ImmuCC: Cell-CentricView of Tissue Transcriptome Measuring Cellular Compositions of ImmuneMicroenvironment From Mouse RNA-Seq Data”为题,于2018年6月发表于国际期刊Frontiersin Immunology。
吴爱平教授的课题组已经成功开发了两个计算模型,从组织样本的芯片表达谱。