一个MeDIP-seq实战-超级简单-2小时搞定！

对于CHIP-seq数据处理完全是自学的，所以有很多细节得慢慢学习回来，这次记录的就是当我们把测序仪的fastq数据比对到参考基因组之后，应该对比对的结果文件做什么样的处理，然后去给peaks caller软件拿来call peaks呢？我看过博客提到只保留比对质量值大于30的，也看过博客提到只保留unique比对的reads，我这里拿一篇公共数据测试了一下它们的区别！数据描述如下： Continue reading →

八 02

根据比对的bam文件来对peaks区域可视化

Posted on 2016年8月2日 by ulwvfje

之前分析了好几个公共项目，拿到的peaks都很诡异，搞得我一直怀疑是不是自己分析错了。终于，功夫不负有心人，我分析了一个数据，它的peaks非常完美！！！可以证明，我的分析流程以及peaks绘图代码并没有错！数据来自于http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE74311，是关于H3K27ac_ChIP-Seq_LOUCY，组蛋白修饰的CHIP-seq数据，很容易就下载了作者上传的测序数据，然后跑了我的流程！https://github.com/jmzeng1314/NGS-pipeline/tree/master/CHIPseq Continue reading →

七 28

4种方式下载roadmap计划的所有数据

Posted on 2016年7月28日 by ulwvfje

roadmap的官网是：http://www.roadmapepigenomics.org/

精选的129个细胞系，细胞系的介绍如下：http://www.broadinstitute.org/~anshul/projects/roadmap/metadata/EID_metadata.tab

对每个细胞系，都至少处理了5个核心组蛋白修饰数据，还有其它若干转录因子数据。

官网介绍的很详细，我就不翻译了：

Continue reading →

七 28

6种方式下载ENCODE计划的所有数据

Posted on 2016年7月28日 by ulwvfje

DNA元件百科全书(Encyclopedia of DNA Elements, ENCODE)ENCODE计划的重要性我就不多说了，如果大家还不是很了解，可以直接跳到本文末尾去下载一下ENCODE教程，好好学习。该计划采用以下几种高通量测序技术来刻画了超过100种不同的细胞系或者组织内的全基因组范围内的基因调控元件信息。本来只是针对人类的，后来对mouse以及fly等模式生物也开始测这些数据并进行分析了，叫做 modENCODE

chromatin structure (5C)

open chromatin (DNase-seq and FAIRE-seq)

histone modifications and DNA-binding of over 100 transcription factors (ChIP-seq)

RNA transcription (RNAseq and CAGE)

Continue reading →

七 26

用UCSC提供的Genome Browser工具来可视化customTrack

Posted on 2016年7月26日 by ulwvfje

customTrack，我这里翻译为自定义的测序片段示踪文件，可以追踪我们的reads到底比对到了参加基因组的什么区域，或者追踪参考基因组的各个区域的覆盖度，测序深度！翻译自：http://genome.ucsc.edu/goldenPath/help/customTrack.html 这个非常有用！！！

UCSC提供的Genome Browser工具非常好用，可以很方便的浏览我们的测序数据在参考基因组的比对情况，由于定义好了一系列track的文件格式，用户可以非常方便的上传自己的track文件，但是如果用户超过48小时没有浏览自己的数据，UCSC会默认删除掉这些数据，除非用户已经保存在session里面。或者用户可以分享这些自定义的reads示踪文件customTrack。

Continue reading →

七 26

wig、bigWig和bedgraph文件详解

Posted on 2016年7月26日 by ulwvfje

我们一般会熟悉sam/bam格式文件，就是把测序reads比对到参考基因组后的文件！bam或者bed格式的文件主要是为了追踪我们的reads到底比对到了参加基因组的什么区域，而UCSC规定的这几个文件格式(wig、bigWig和bedgraph)用处不一样，仅仅是为了追踪参考基因组的各个区域的覆盖度，测序深度！而且这些定义好的文件，可以无缝连接到UCSC的Genome Browser工具里面进行可视化！

这个网站提供了这几种数据格式的构造及转换脚本：http://barcwiki.wi.mit.edu/wiki/SOPs/coordinates

对SE数据，可以用macs2 pileup --extsize 200 -i $sample.bam -o $sample.bdg 把bam文件转换为bedgraph文件，不需要call peaks这一步骤。

而UCSC的ftp里面可以下载bedGraphToBigWig $sample.bdg ~/reference/genome/mm10/mm10.chrom.sizes $sample.bw 把bedgraph文件转换为bw文件，其余的转换工具都可以下载。

Continue reading →

七 14

ChIP-Seq文献数据重新分析解读第二例

Posted on 2016年7月14日 by ulwvfje

paper:2014-BRCA1-PALB2-CHIP-seq:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4194113/

这篇文章是朋友推荐的，我觉得作为CHIP-seq学习材料再好不过了，所以推荐给大家。是全基因组范围的BRCA1和PALB2的转录共激活机制的探究。请务必先看我的CHIP-seq自学系列教程，跟着好好学习！数据如下：

GSM997540 BRCA1 SRR553473.sra Read 18878514 spots

GSM997541 PALB2 SRR553474.sra Read 17615498 spots

GSM997542 P_Ser2 SRR553475.sra Read 35396009 spots

Continue reading →

七 13

ChIP-Seq文献数据重新分析解读第一例

Posted on 2016年7月13日 by ulwvfje

文章是：Genome-wide maps of H3K4me2/3 in prostate cancer cell line LNCaP，数据在GEO可以下载。GSE20042，下面的所有分析，需要26G的空间。

作者想看看用 dihydrotestosterone （雄激素）处理了 cancer cell line LNCaP 这个细胞系之后，看看组蛋白甲基化修饰变化，主要是看H3K4me2和H3K4me3这两种组蛋白甲基化区别，分成三组，分别是处理前，处理后4H和16H，共有5个条件的数据，但是有7个fastq文件。

Continue reading →

生信菜鸟团

欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee

Category Archives: CHIP-seq

一个MeDIP-seq实战-超级简单-2小时搞定！

Featured

一个RNA-seq实战-超级简单-2小时搞定！

一个ChIP-seq实战-超级简单-2小时搞定！

ngsplot辅助CHIP-seq数据分析-可视化

生物信息数据分析文章就是看图写作文

deeptools辅助CHIP-seq数据分析-可视化

对CHIP-seq数据call peaks应该选取unique比对的reads吗？

根据比对的bam文件来对peaks区域可视化

4种方式下载roadmap计划的所有数据

6种方式下载ENCODE计划的所有数据

用UCSC提供的Genome Browser工具来可视化customTrack

wig、bigWig和bedgraph文件详解

ChIP-Seq文献数据重新分析解读第二例

ChIP-Seq文献数据重新分析解读第一例

2025年4月
一	二	三	四	五	六	日
« 九
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30