表观调控领域关于DNA甲基化的研究绝对是一个热点,尤其是有那么多的技术,WGBS,RRBS,450K/850K芯片。早在2014年发表于Genome Biology 的文章:DNA methylome profiling of human tissues identifies global and tissue-specific methylation patterns 就设计实验系统性探索了 DNA甲基化的组织特异性。
该课题的实验设计是,从4个尸体解剖的人身上提取17种不同的组织部位去做450K甲基化芯片数据,在 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50192 所以是17*4=68个芯片数据,不知道为什么上面是70个,可能是有两个样品测了两次吧。该数据是以 GSE50192_GPL13534_Matrix_signal_intensities_raw_data.txt.gz 形式公开,不过也有 https://ftp.ncbi.nlm.nih.gov/geo/series/GSE50nnn/GSE50192/matrix/GSE50192_series_matrix.txt.gz 文件,非常方便处理。关于 Illumina Infinium HumanMethylation450 BeadChip芯片的数据处理见文末。
这4个尸体解剖的人死亡原因分别是;
- intracerebral hemorrhage (BM419/4; female, 60 years old),
- heart attack with acute cardiac insufficiency (KA522; male, 53 years old),
- heart attack (KT538; male, 40 years old),
- intracerebral hemorrhage (SJ600-5; male, 54 years old).
我推测研究者肯定是拿全部的45万个甲基化位点的信号值计算相关性,所以结论是The methylation patterns were found to be well conserved between the 17 various tissues that were studied。如下:
另外很重要的结论是: - only 2.2% of all the CpGs (10,707 CpGs representing 4,416 genes) were hypermethylated in all of the samples (beta values >0.9).
- On the other hand, 14.9% of CpGs (72,444 CpGs representing 12,604 genes) were hypomethylated in all of the samples (beta values <0.1).
然后作者就探索这样的甲基化位点所在的基因功能区域分布情况,已经上面的基因功能。
然后采用一对多的差异分析策略,去分别独立探索每个组织与所有的其它组织的tissue-specific differentially methylated regions (tDMRs) ,得到的数量分布如下:
学徒作业:根据文末的甲基化教程目录以及教学视频,下载这个GSE50192数据集,并且把甲基化位点注释后区分开来,独立绘制甲基化信号值热图。因为位于基因组不同功能区域的甲基化探针信号值代表的生物学意义不一样,包括5’ UTR, first exon, gene body, 3’ UTR, CpG island, CpG shore, CpG shelf,这些注释,都是在厂商提供注释文件信息里面。甲基化教程目录
- 01-甲基化的一些基础知识.pdf
- 02-甲基化芯片的一般分析流程.pdf
- 03-甲基化芯片数据下载的多种技巧.pdf
- 04-甲基化芯片数据下载如何读入到R里面.pdf
- 05-甲基化芯片数据的一些质控指标.pdf
- 06-甲基化信号值矩阵差异分析哪家强.pdf
- 07-甲基化芯片信号值矩阵差异分析的标准代码.pdf
- 08-TCGA数据库的各个癌症甲基化芯片数据重新分析.pdf
- 09-TCGA数据库的癌症甲基化芯片数据重分析.pdf
- 10-TCGA数据辅助甲基化区域的功能研究.pdf
- 11-按基因在染色体上的顺序画差异甲基化热图.pdf
- 12-甲基化信号值矩阵差异分析主要图表
- 850K甲基化芯片数据的分析.pdf
- 使用DSS包多种方式检验差异甲基化信号区域.pdf
甲基化芯片视频课程免费在B站
《甲基化芯片(450K或者850K)数据处理 》
- 教学视频免费在:https://www.bilibili.com/video/BV177411U7oj
- 课程配套思维导图:https://mubu.com/doc/1cwlFgcXMg
- 甲基化芯片相关资料,https://share.weiyun.com/42a9e78c2dd5367f3427e86c5c99baa1 按需下载,不要整个文件夹全部下载
- 表观全部资料,https://share.weiyun.com/5tg6pIn 同样是按需下载,不要整个文件夹全部下载
当然了,如果你完全看不懂这些,说明你可能需要手把手教学,考虑一下生信技能树官方入门学习班哦!文末友情推荐
要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160 。
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班: - 数据挖掘学习班第5期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。
- 生信爆款入门-第7期(线上直播4周,马拉松式陪伴,带你入门),原价9600的生信入门全套课程,疫情期间3.3折即可抢购。
如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?
号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!另外,:绝大部分生信技能树粉丝都没有机会加我微信,已经多次满了5000好友,所以我开通了一个微信好友,前100名添加我,仅需150元即可,3折优惠期机会不容错过哈。我的微信小号二维码在:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》