02

TCGA计划的4个找somatic mutation的软件使用体验

TCGA计划的4个找somatic mutation的软件使用体验

体细胞突变(somatic mutation)是指患者某些组织或者器官后天性地发生了体细胞变异,虽然它不会遗传给后代个体,却可以通过细胞分裂,遗传给子代细胞。体细胞突变对肿瘤的发生发展有关键性的作用,并且它也是制定肿瘤癌症靶向治疗措施的关键所在。NGS使体细胞变异的检测更加全面,成本更低,在检测多种体细胞变异上具有很大的优势,但在使用过程中还存在着挑战:如样品降解、覆盖度不足、遗传异质性和组织污染(杂质)等问题。 为应对以上挑战,降低错误率,科学家采取了不同的算法和统计模型用于检测体细胞突变。目前最受欢迎的有Varscan、SomaticSniper、 Strelka 和MuTect2

Continue reading

31

从WGS测序得到的VCF文件里面提取位于EXON区域的

首先要下载并且得到人类基因组的外显子坐标记录文件

这里我用的参考基因组版本仍然是hg19,所以去CCDS数据库里面下载对应版本,并且格式化成BED文件。

wget ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/archive/Hs37.3/CCDS.20110907.txt
cat CCDS.20110907.txt |perl -alne '{/[(.*?)]/;next unless $1;$exons=$1;$exons=~s/\s//g;$exons=~s/-/\t/g;print "$F[0]\t$" foreach split/,/,$exons;}' >hg19exon.bed

Continue reading

06

我学会docker啦!希望你也可以学会

​写在前面

以前胡兄为我们生信技能树公众号写一个阿里云服务器处理RNA-seq和ChIP-seq数据(点击阅读)的教程的时候提到了docker这个打包技术,可以迅速的重现一个pipeline。虽然我以前也偶尔看到过这个名词,但是这是它第一次以生物信息学相关角色进入我的知识库。

这么神奇的东东,我岂能错过。下面就简单描述一下我的学习过程及理解: Continue reading

01

我会学习R的bookdown,因为这个博客

当然,我是先搜索到了R的bookdown,再看到他到博客的,http://www.pzhao.org/zh/
很佩服博主,不仅仅是因为他r语言玩的很溜,更重要的是是他的人生经历。
大家直接去他的博客浏览哈,我也会跟着学习的。
bookdown的详细介绍见使用手册。他的使用体验写成了三篇帖子:

Continue reading

12

perl模块安装大全

今天又有小伙伴微信问我perl模块安装的问题,因为ENSEMBL发布的大多数数据库以及软件都是基于perl的,尤其是分量很重的VEP,所以即使你再如何如何的讨厌perl,也不得不与之打交道。

这种细节问题问我,我当然无法直接给出答案咯。毕竟,我的知识积累都不是靠死记硬背的。所以需要取回过头查看一下我的博客,才意识到,我竟然已经写了7篇教程,关于perl的模块。目录如下:

首先需要自己确定已经安装了哪些模块,都安装在哪里?还有新的模块需要安装到哪里?
然后再学习如何安装新的模块。

Continue reading

05

文献阅读笔记-DIPG里面的Super-enhancers可能是治疗靶点

背景:
Diffuse intrinsic pontine glioma (DIPG) is a universally fatal pediatric cancer.
A histone-3 K27M mutation affects ∼80% of DIPGs and drives aberrant transcription.

早在2015年的83个药物对14个DIPG细胞系的筛选实验中,就发现哪怕是效果最好的multi-HDAC inhibitor panobinostat也会被某些DIPG细胞系产生耐药性。(http://www.biotrainee.com/thread-1599-1-1.htmlContinue reading

05

文献阅读笔记-对肿瘤细胞系进行药物筛查

我看到一篇nature medicine文章里面提到了这个对肿瘤细胞系进行药物筛查文章链接:https://www.nature.com/nm/journal/v21/n6/full/nm.3855.html

首先,肿瘤细胞系是:

We assembled a panel of 14 patient-derived DIPG cell cultures, created using neurosphere and adherent models and obtained from both biopsy and autopsy samples (Fig. 1a), representing the breadth of DIPG cell cultures available worldwide at the initiation of the study. Continue reading

05

文献阅读笔记-2014-K27M-H3.3-DIPG

DIPG和 adult glioblastomas (GBMs) 很大区别,不应该用同样的治疗方式。

测序策略是:

We integrated deep sequencing analysis of 36 tumor-normal pairs (20 whole-genome sequencing (Illumina HiSeq 2000) and 16 whole-exome sequencing (Applied Biosystems SOLiD 5500xl)) with comprehensive methylation (28 DIPGs; Illumina Infinium450k methylation array), copy number (45 DIPGs; Affymetrix SNP6.0) and expression (35 DIPGs; Illumina HT-12 v4) data (Supplementary Table 1).  Continue reading

05

文献阅读笔记-2013-H3K27me3 and K27M mutation

这篇文章是Received 29 March 2013, Revised 9 August 2013, Accepted 4 October 2013, Available online 31 October 2013

同时还有17 MAY 2013一篇science文章提到了K27M mutant影响了PRC2活性

we performed IHC for H3K27me3 in a large cohort of pHGGs with known H3F3A mutation status (n = 104).

Strikingly, all K27M mutant pHGGs (n = 21) showed a strong reduction of overall H3K27me3 levels.

这篇文章就这一个目的,抢这个热点。
Continue reading

05

文献阅读笔记-2012–Hotspot Mutations GBM

这篇文章最重要的观点是甲基化用来给GBM分组,分成了6组,至于突变什么的,随便讲了讲,反正数据也不给下载。

We identified six epigenetic and biological GBM subgroups displaying distinct global DNA methylation patterns, which harbor unique hotspot mutations, DNA copy-number alterations, and transcriptomic patterns.

分组如下: Continue reading

05

文献阅读笔记,2012-Driver mutations-GBM

主要是做测序

To decipher the molecular pathogenesis of paediatric GBM, we undertook a comprehensive mutation analysis in protein-coding genes by performing whole-exome sequencing (WES) on 48 well-characterized paediatric GBMs, including 6 patients for whom we had matched non-tumour (germline) DNA.

只有6个患者有NT配对样本,用来找somatic的mutation,结果发现其中4个患者就有H3F3A的突变,但是H3F3A本身是非常保守的,所以这个现象值得研究。

to our knowledge no human disorders have specifically been associated with mutations in histones, including H3.3

所以才扩大了WES测序样本数量。 Continue reading

28

我测试了一下Jbrowse的安装及初步试用

前些天我们公众号元老,熊,投稿了关于Jbrowse的史上最全介绍,如下:

可能是最全的JBrowse基因浏览器介绍(请点击阅读)

发现下面文章的图片都挂掉了,请直接点击这个链接查看:http://mp.weixin.qq.com/s/P32LxR-cFPN3pw25ba5sIg,下面不用看了,反正没有图片了

这个现象很奇怪:博客和公众号,都是用的有道云分享出来的图片,结果博客里面的图片挂掉了,微信里面还有!

最为生物信息学痴的我当然不能错过,今天终于找到了空隙时间来体验一把!

全部体验报告如下:

Continue reading

我用rmarkdown写过的教程

Featured

用rmarkdown写教程真心非常方便,尤其是R语言相关的,比如一些R包的应用,或者一些可视化,或者一些统计,下面我简单列出一些我以前写过的,图文并茂,关键是还非常省心,不需要排版,不需要上传图片,整理图片。

一般来说看链接最后的文件名就知道这篇文章讲的是什么了:

Continue reading