6种免疫细胞的850K甲基化芯片和转录组测序数据资源

看到很多小伙伴翻来覆去就是TCGA数据挖掘,而且绝大部分都仅限于转录组数据,虽然会根据基因性质拆分成为蛋白编码基因和非编码,但是数据多样性真的好有限。非常有必要系统性整理一些公共数据资源推广开。
比如在李程老师的交流群看到了Roy et al., 于2021年11月发表在, Immunity 杂志的文章:《DNA methylation signatures reveal that distinct combinations of transcription factors specify human immune cell epigenetic identity》,链接是:https://doi.org/10.1016/j.immuni.2021.10.001
就做了6种免疫细胞的850K甲基化芯片和转录组测序数据,数据都是公开是:

Methylation data GEO: GSE184269
RNASeq data This paper GEO: GSE184264
EBF1 Chip-Seq data GEO: GSE183537

可以很清楚看到免疫细胞分类情况:
免疫细胞分类情况
主要是淋巴系和髓系免疫细胞,做过单细胞转录组数据处理的小伙伴应该是很熟悉了,淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)。

首先是6种免疫细胞的850K甲基化芯片数据

链接是;https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE184269 使用的是Infinium MethylationEPIC芯片,就是850K甲基化芯片,有167个样品:
差异分析策略如下所示:
差异分析策略
可以看到,每次差异分析都是取其中一个分组都是跟其它的全部样品进行差异分析,差异分析结果可视化:
差异分析结果可视化
主要是统计了各个细胞亚群跟其它样品的甲基化差异数量,而且取这些位点进行热图可视化!
有差异的甲基化位点对应的基因的生物学功能数据库注释:
生物学功能数据库注释
差异分析的前提是数据质量OK,哪怕是甲基化矩阵,也需要同样的质量控制 :
主成分
甲基化测序的 WGBS和RRBS,还有 芯片是最高频的甲基化技术,其中甲基化芯片数据处理我是有视频课程的,首先需要阅读我在生信技能树的甲基化系列教程,目录如下

Comments are closed.