GitHub的R包毕竟没那么可靠

最近又需要使用一个肿瘤外显子看cnv的R包,根据全局的vcf文件,就是FACETS,发表该包的文章是:FACETS: allele-specific copy number and clonal … - NCBI - NIH

是大名鼎鼎的MSKCC单位的研究人员开发的, 作者:R Shen - ‎2016 - ‎被引用次数:189 - ‎相关文章

2016年6月7日 - (1) Department of Epidemiology and Biostatistics, Memorial Sloan-Kettering Cancer Center, New York, NY 10065

发表已经很久了,以前安装FACETS没啥问题,两年过去了,这个包还在GitHub上面,我电脑系统都升级好几次了,R语言本身也是一个非常大的变革,现在需要重新安装它!然后就遇到报错,如下:

creating vignettes (8s)
 --- re-building ‘FACETS.Rnw’ using Sweave
 Loading required package: pctGCdata
 Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
 Running 'texi2dvi' on 'FACETS.tex' failed.
 --- failed re-building ‘FACETS.Rnw’

 SUMMARY: processing the following file failed:
 ‘FACETS.Rnw’

 Error: Vignette re-building failed.
 Execution halted
Error: Failed to install 'facets' from GitHub:
 System command error, exit status: 1, stdout + stderr (last 10 lines):
E> Loading required package: pctGCdata
E> Error: processing vignette 'FACETS.Rnw' failed with diagnostics:
E> Running 'texi2dvi' on 'FACETS.tex' failed.
E> --- failed re-building ‘FACETS.Rnw’
E> 
E> SUMMARY: processing the following file failed:
E> ‘FACETS.Rnw’
E> 
E> Error: Vignette re-building failed.
E> Execution halted

很明显,是作者包里面的一个说明文档有问题, ‘FACETS.Rnw’ 其实自行下载其源代码,然后删除 ‘FACETS.Rnw’即可,说明书本身不影响软件功能,删除它其实无伤大雅!

自行下载R包源代码编译

因为是从GitHub下载,所以网速很重要: git clone https://github.com/mskcc/facets

Cloning into 'facets'...
remote: Enumerating objects: 11, done.
remote: Counting objects: 100% (11/11), done.
remote: Compressing objects: 100% (10/10), done.
remote: Total 748 (delta 1), reused 4 (delta 1), pack-reused 737
Receiving objects: 100% (748/748), 27.04 MiB | 5.44 MiB/s, done.
Resolving deltas: 100% (448/448), done.

下载成功后删除 ‘FACETS.Rnw’即可,然后重新编译

** R
** inst
** byte-compile and prepare package for lazy loading
** help
*** installing help indices
** building package indices
** installing vignettes
** testing if installed package can be loaded from temporary location
** checking absolute paths in shared objects and dynamic libraries
** testing if installed package can be loaded from final location
** testing if installed package keeps a record of temporary installation path
* DONE (facets)

可以看到很轻松就安装成功啦,其实就是需要你仔细,认真读报错信息,思考。

其实它在2018有一个更新

不过我没有时间和精力试用了,如果大家也做肿瘤外显子呢,不妨去学习一下。值得提醒的是,如果你重新设计肿瘤相关外显子项目,最好是保证平均测序深度大于200。

If using facets-suite in a publication, please cite:
Bielski, C.M., et al. “Widespread Selection for Oncogenic Mutant Allele Imbalance in Cancer.” Cancer cell (2018). PMID: 30393068

当然了,我在GitHub的包同样的不那么可靠

我在2019年的尾巴推出3个R包,目前都是托管在GitHub,暂时没有时间整合后发布在bioconductor,大家只好将就着使用吧!

  • 第一个是整合全部的bioconductor里面的芯片探针注释包。
  • 第二个是整合全部GPL的soft文件里面的芯片探针注释包。
  • 第三个是下载全部的GPL的soft文件里面的探针碱基序列比对后注释包。

配合着详细的介绍:

因为这些包暂时托管在GitHub平台,但是非常多的朋友访问GitHub困难,尤其是我打包了好几百个GPL平台的注释信息后, 我的GitHub包变得非常臃肿,大家下载安装困难,所以我重新写一个精简包。也在:芯片探针ID的基因注释以前很麻烦 和 :芯片探针序列的基因注释已经无需你自己亲自做了, 里面详细介绍了。最重要的是idmap函数,安装方法说到过:芯片探针序列的基因注释已经无需你自己亲自做了, 使用起来也非常简单:

library(AnnoProbe)
ids=idmap('GPL570',type = 'soft')
head(ids)

仅仅是一句话,就拿到了这个平台的探针的注释信息。需要注意的是,这个函数的type参数,其实是有3个选择,这里我演示的是选择soft这个来源的基因注释信息。

并不是所有的平台都是有soft注释,也不是所有的平台都被我的这个工具囊括哦。

Comments are closed.