最近又需要使用一个肿瘤外显子看cnv的R包,根据全局的vcf文件,就是FACETS,发表该包的文章是:FACETS: allele-specific copy number and clonal … - NCBI - NIH
是大名鼎鼎的MSKCC单位的研究人员开发的, 作者:R Shen - 2016 - 被引用次数:189 - 相关文章
2016年6月7日 - (1) Department of Epidemiology and Biostatistics, Memorial Sloan-Kettering Cancer Center, New York, NY 10065
发表已经很久了,以前安装FACETS没啥问题,两年过去了,这个包还在GitHub上面,我电脑系统都升级好几次了,R语言本身也是一个非常大的变革,现在需要重新安装它!然后就遇到报错,如下:
creating vignettes (8s)
--- re-building ‘FACETS.Rnw’ using Sweave
Loading required package: pctGCdata
Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
Running 'texi2dvi' on 'FACETS.tex' failed.
--- failed re-building ‘FACETS.Rnw’
SUMMARY: processing the following file failed:
‘FACETS.Rnw’
Error: Vignette re-building failed.
Execution halted
Error: Failed to install 'facets' from GitHub:
System command error, exit status: 1, stdout + stderr (last 10 lines):
E> Loading required package: pctGCdata
E> Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
E> Running 'texi2dvi' on 'FACETS.tex' failed.
E> --- failed re-building ‘FACETS.Rnw’
E>
E> SUMMARY: processing the following file failed:
E> ‘FACETS.Rnw’
E>
E> Error: Vignette re-building failed.
E> Execution halted
很明显,是作者包里面的一个说明文档有问题, ‘FACETS.Rnw’ 其实自行下载其源代码,然后删除 ‘FACETS.Rnw’即可,说明书本身不影响软件功能,删除它其实无伤大雅!
自行下载R包源代码编译
因为是从GitHub下载,所以网速很重要: git clone https://github.com/mskcc/facets
Cloning into 'facets'...
remote: Enumerating objects: 11, done.
remote: Counting objects: 100% (11/11), done.
remote: Compressing objects: 100% (10/10), done.
remote: Total 748 (delta 1), reused 4 (delta 1), pack-reused 737
Receiving objects: 100% (748/748), 27.04 MiB | 5.44 MiB/s, done.
Resolving deltas: 100% (448/448), done.
下载成功后删除 ‘FACETS.Rnw’即可,然后重新编译
** R
** inst
** byte-compile and prepare package for lazy loading
** help
*** installing help indices
** building package indices
** installing vignettes
** testing if installed package can be loaded from temporary location
** checking absolute paths in shared objects and dynamic libraries
** testing if installed package can be loaded from final location
** testing if installed package keeps a record of temporary installation path
* DONE (facets)
可以看到很轻松就安装成功啦,其实就是需要你仔细,认真读报错信息,思考。
其实它在2018有一个更新
不过我没有时间和精力试用了,如果大家也做肿瘤外显子呢,不妨去学习一下。值得提醒的是,如果你重新设计肿瘤相关外显子项目,最好是保证平均测序深度大于200。
If using facets-suite
in a publication, please cite:
Bielski, C.M., et al. “Widespread Selection for Oncogenic Mutant Allele Imbalance in Cancer.” Cancer cell (2018). PMID: 30393068
当然了,我在GitHub的包同样的不那么可靠
我在2019年的尾巴推出3个R包,目前都是托管在GitHub,暂时没有时间整合后发布在bioconductor,大家只好将就着使用吧!
- 第一个是整合全部的bioconductor里面的芯片探针注释包。
- 第二个是整合全部GPL的soft文件里面的芯片探针注释包。
- 第三个是下载全部的GPL的soft文件里面的探针碱基序列比对后注释包。
配合着详细的介绍:
因为这些包暂时托管在GitHub平台,但是非常多的朋友访问GitHub困难,尤其是我打包了好几百个GPL平台的注释信息后, 我的GitHub包变得非常臃肿,大家下载安装困难,所以我重新写一个精简包。也在:芯片探针ID的基因注释以前很麻烦 和 :芯片探针序列的基因注释已经无需你自己亲自做了, 里面详细介绍了。最重要的是idmap函数,安装方法说到过:芯片探针序列的基因注释已经无需你自己亲自做了, 使用起来也非常简单:
library(AnnoProbe)
ids=idmap('GPL570',type = 'soft')
head(ids)
仅仅是一句话,就拿到了这个平台的探针的注释信息。需要注意的是,这个函数的type参数,其实是有3个选择,这里我演示的是选择soft这个来源的基因注释信息。
并不是所有的平台都是有soft注释,也不是所有的平台都被我的这个工具囊括哦。