Gene Set Knowledgebase (GSKB),完全借鉴于GSEA算法的MSigDB (molecular signature database),数据库,同样是大名鼎鼎的broad开发,也是分成7类: Continue reading
使用PGSEA包进行基因集分析
GSEA 相信看过我生信菜鸟团博客的朋友都已经耳熟能详了的,其需要样本的描述以及分组信息,虽然有ssGSEA这样的单样本的分析,但仍然不够,也有GSVA这样的算法来弥补,这里要介绍的是另外一个包,PGSEA。 Continue reading
新的致癌基因KLHL22
一个月前朋友刚刚推荐了2018的nature The protein histidine phosphatase LHPP is a tumour suppressor 阐述了一个新的抑癌基因LHPP,今天又有朋友推荐了一个新的致癌基因KLHL22 ,文章是:KLHL22 activates amino-acid-dependent mTORC1 signalling to promote tumorigenesis and ageing.
在PubMed查询:https://www.ncbi.nlm.nih.gov/pubmed/?term=KLHL22
https://www.genecards.org/cgi-bin/carddisp.pl?gene=KLHL22 Continue reading
reactome数据库2018更新啦
发表在 Nucleic Acids Research, January 2018, , https://doi.org/10.1093/nar/gkx1132 Continue reading
长矩阵变成宽矩阵
如果是简单的转换问题,我们的生信技能树: 生信编程直播第四题:多个同样的行列式文件合并起来 里面详细讲解了这个操作:http://www.biotrainee.com/thread-603-1-1.html Continue reading
clinvar数据库重新解读
在很久以前的我直播基因组活动,我提到过这个数据库: 【直播】我的基因组67:clinvar数据库 Continue reading
使用单细胞多组学探索TNBC病人的新辅助化疗疗效
文章发表于:Cell. 2018 May
counts2rpkm
为什么要做这个计算
大家都知道在真核生物里面,一个基因有多个转录本,每个转录组又是由不同的外显子组合而成,以前老旧的RNA-seq分析流程比较喜欢用RPKM值来量化表达量。大家很容易可以搜索到RPKM的公式,里面考虑到了基因长度。 Continue reading
把vcf文件转换为maf格式
假设已经安装了VEP软件,对自己的vcf进行了注释,然后就可以进行转换:
https://github.com/mskcc/vcf2maf
安装GitHub上面的小工具 Continue reading
STAR的速度为何如此诡异
同样的fastq文件大小,时间完全不一样!
多位点取样测序看肿瘤异质性的文章合辑
There are at least three types of intratumoral genetic heterogeneity
reactome数据库更新啦
reactome数据库更新啦
发表在 Nucleic Acids Research, January 2018, , https://doi.org/10.1093/nar/gkx1132 Continue reading
car包中的三个函数改善线性与异方差性。
在《R in action》一书中提及了car包中的三个函数powerTransform(),boxTidwell(),spreadLevelPlot()来改善线性与异方差性。 Continue reading
这可能是最易于理解的肿瘤异质性参考资料了
来自于Florian的博客: https://scientificbsides.wordpress.com/ Continue reading
校正批次效应
但很多时候,数据分析者往往身不由己。 Continue reading
单细胞探索EMT中间态
把GDSC数据应用到GSE9782数据集
先了解背景知识:http://www.bio-info-trainee.com/3263.html 并且下载数据。
再探索并且完全理解GDSC数据背景: http://www.bio-info-trainee.com/3266.html
详细了解GDSC数据库
先了解背景知识:http://www.bio-info-trainee.com/3263.html 并且下载数据 Continue reading
使用CGP数据库的表达矩阵进行药物反应预测
发表这个算法的文章是:Clinical drug response can be predicted using baseline gene expression levels and in vitro drug sensitivity in cell lines 发表时间是:Genome Biology 2014 https://doi.org/10.1186/gb-2014-15-3-r47 Continue reading
使用GSVA方法计算某基因集在各个样本的表现
文章发表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 研究生出品,其在2005年PNAS发表的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。 Continue reading