前些天我们公众号元老,熊,投稿了关于Jbrowse的史上最全介绍,如下:
可能是最全的JBrowse基因浏览器介绍(请点击阅读)
发现下面文章的图片都挂掉了,请直接点击这个链接查看:http://mp.weixin.qq.com/s/P32LxR-cFPN3pw25ba5sIg,下面不用看了,反正没有图片了
这个现象很奇怪:博客和公众号,都是用的有道云分享出来的图片,结果博客里面的图片挂掉了,微信里面还有!
最为生物信息学痴的我当然不能错过,今天终于找到了空隙时间来体验一把!
全部体验报告如下:
起初我是在windows安装这个的,因为是浏览器而已嘛
下载jbrowse最新版解压,然后setup,但是log日志显示全部失败了,如下:
http://gmod.org/wiki/JBrowse_FAQ 我简单浏览了一下FAQ;
似乎我想的简单了,还是去我的linux里面安装吧~
用的是下面的方法来安装jbrowse:
如果失败了,是下面这样:
如果成功了是下面这样:
其实上面两个截然不同的结果只是因为我用的是不同的服务器,前者是腾讯云,ubuntu14,后者是亚马逊云,ubuntu16,作为生物出身的生信工程师,我其实很烦这种计算机配置错误,没有学过原理,只能凭直觉和谷歌一步步解决,最后也只是解决了问题而已。
我简单搜索了一下两者的setup.log文件,发现腾讯云的ubuntu14之所以会failed,是因为好几个perl模块没有自动安装成功。
XML::DOM
XML::Parser
Bio::FeatureIO
List::MoreUtils
我只好用cpan手动安装了这几个模块:http://www.biotrainee.com/thread-1257-1-1.html
理论上成功之后,两个测试数据是可以直接访问了的,如下:
我是在我们论坛上面安装的,所以应该是:
只访问测试数据当然不算成功啦,我们要学会自己做数据,这里我选择bowtie2自动的参考基因组和测序数据来用Jbrowse格式化好数据以供访问。
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip
unzip bowtie2-2.2.9-linux-x86_64.zip
有了这些测试数据,我们就可以先看看示例数据是什么,然后把我们的测试数据做出那个样子:
可以看到里面有3个文件夹,其中seq是存放json格式化的参考基因组的。
mkdir bowtie2_data
第一步,准备参考基因组
bin/prepare-refseqs.pl --fasta bowtie2-2.2.9/example/reference/lambda_virus.fa --out bowtie2_data/
这个时候已经可以浏览配置好的基因组了
第二步,准备特征序列
貌似这个测试数据没有,因为这个是病毒基因组,如果有的话用下面 命令即可。
bin/flatfile-to-json.pl --[gff|gbk|bed] <flat file> --tracklabel <track name> [options]
只有两个必要的参数, --gff/bed用来指定数据格式,而 --tracklabel 用来给track设定ID(track 的身份证号),非必需的 --key参数可以理解为track 的名字
第三步,准备展示数据
这里是sort好的bam文件的比对结果。
./bowtie2-2.2.9/bowtie2 -x ./bowtie2-2.2.9/example/index/lambda_virus -U ./bowtie2-2.2.9/example/reads/longreads.fq | samtools sort -O bam -o test.bam
samtools index test.bam
要运行上面代码必须保证samtools 版本是最新的,比如Version: 1.3.1
然后就修改 tracks.conf文件即可,文件内容如下:
[tracks.alignments]
urlTemplate=../test.bam
type=Alignments2
以上3个步骤并不是都一定要做,只有参考基因组也可以的。参考基因组+bam文件也可以。
结果展示如下:
这个网页粗看起来就这样了,但是细节很坑的,需要花费时间还是挺长的,如果想真正做到定制化。