五年前,我们有一个蛋白质组学数据处理的实战微信交流群,详见:蛋白质组学习小组起飞啦! ,在群里我们整理和分享的是:
- 蛋白质组学第1期-认识基础概念
- 蛋白质组学第2期-认识蛋白质组学原始数据
- 蛋白质组学第3期-蛋白质组学的三大元素
- 蛋白质组学第4期 文章搜库过程复现
- 蛋白质组学第5期搜库软件之 MaxQuant 再介绍
- 蛋白质组学第6期 搜库软件之 MaxQuant 结果数据介绍
- 蛋白质组学第7期 复现文章数据- 预处理之Perseus 的使用
- 蛋白质组学第8期 文章复现之数据处理
- 蛋白质组学第9期 文章数据分析之差异蛋白筛选和功能分析
实际上这个专辑仅仅是简单的过了一遍蛋白质组的搜库和使用网页工具进行差异分析和富集分析,内容也不够详尽。过去的五年间也确实是有很多小伙伴看到了这个专辑后在我们的公众号后台询问深度学习蛋白质组学数据处理的资料,但其实我们是没有的,因为我自己的精力主要是在NGS多组学以及单细胞系列数据处理上面。从来就没有过蛋白质组学数据处理的项目,谈何分享这方面经验呢?
这里强烈推荐一个长达5天的b站视频:https://www.bilibili.com/video/BV1Wd4y1D7gz ,是蛋白质组学数据分析一本通,授课内容大纲是 :
上传在b站的视频目录如下所示:
- P1 01.质谱原理_1 51:01
- P2 01.质谱原理_2 1:01:11
- P3 01.质谱原理_3 37:04
- P4 02.蛋白质组学实验设计 53:36
- P5 03.如何采集高质量的质谱数据:从数据解析的角度看质谱仪工作过程_1 35:16
- P6 04-5 蛋白质组前处理 58:35
- P7 06.数据分析软硬件基本介绍 35:58
- P8 07.thermo质谱数据查看 47:16
- P9 08.bruker数据查看 41:57
- P10 09.蛋白质序列数据库使用 29:24
- P11 10.蛋白质序列相关分析工具与网站介绍 25:37
- P12 11.组学公共数据库操作及数据分享 56:22
- P13 12质谱鉴定 46:17
- P14 13.搜库case 34:52
- P15 14.靶向定量蛋白质组数据分析 53:53
- P16 15.修饰定量蛋白质组及多组学数据分析_4 38:57
- P17 16.蛋白质组数据分析流程及解读 1:04:15
- P18 21.Maxquant操作入门 36:55
- P19 22.1Spectronaut操作入门_part1 1:04:47
- P20 22.2Spectronaut操作入门_part2 53:20
- P21 24.Skyline操作入门 1:06:42
- P22 26.DIAcase
基本上蛋白质组学数据处理的每个环节都讲解的很细致,尤其是前面的10个视频,简直了,细节到一般人根本就很难听懂,所以建议大家可以直接从 (P13 12质谱鉴定 46:17)开始学习哈,专注于数据处理本身:
学徒作业:
学完后可以试试看完成这样的学徒作业,很多文章有蛋白质组数据公开,比如
可以看到是每个样品都是有一个后缀是raw的文件,都是大于1g的文件 :
大家需要下载它,然后走MaxQuant的蛋白质搜库流程哦:
The acquired files were analyzed using MaxQuant (1.6.7.0) and mouse UniProt Isoform fasta (Version: 2019-02-21, number of sequences 25,233) as a source for protein sequences. A 1% FDR was used for controlling false discovery at the peptide and protein level. Only protein detected with a minimum of two peptides were carried forward in analysis.
拿到了表达量矩阵之后的分析基本上就等同于表达量芯片或者转录组测序的数据分析啦,也是可以分组后差异分析,或者大样品聚类分析,拿到了基因列表后也是同样的生物学功能数据库富集分析!