部署shinyGEO

前面我们提到了在我们的shiny服务器部署一个RNA-seq下游分析网页工具,虽然说因为时间关系没办法给它写一步步教程,而且的确类似的工具也太多, 写教程的时间付出并不经济。那我们再介绍一个shinyGEO吧,跟前面的Shiny-Seq名字很相似,应该是主攻芯片数据分析,一个是主动测序数据处理,都是基于表达矩阵的。

一句话描述shinyGEO功能

查看感兴趣的基因在感兴趣的数据集里面,是否有分组后的表达差异或者生存分析的统计学显著性!

所以全文只有一个配图

image-20191115101338201

但是它并不提供芯片探针的ID注释,当然,缺陷实在是有点多,只能说是一个好的学习shiny网页工具制作的例子,并不算是完善的工具。

shinyGEO比较有趣的是,它本身被打包成为了一个R包,同时提供一个网页工具。发表在:Bioinformatics. 2016 Dec 1; 题目是:shinyGEO: a web-based application for analyzing gene expression omnibus datasets.

这两个工具名字类似:

大家可以对比学习!我们下次再介绍scanGEO的用法。

部署shinyGEO需要安装一些R包

基本上是需要设置R包安装镜像的,参考:http://www.bio-info-trainee.com/3727.html 其中 install_github 函数需要从GitHub下载,会有其它难度,我们以前在生信技能树也分享过教程,大家可以自行搜索查看。

因为我是安装在自己的Ubuntu服务器里面,所以其实还蛮难的,各种报错,斗智斗勇的解决掉了。如果你不会shiny,就不用管它的部署问题。下载源代码,一步步安装即可,log目录是 /var/log/shiny-server 只有同属于shiny组的用户才能访问,只有在需要调试代码的时候才需要去查看默认程序存放在:/srv/shiny-server ,我们的这个网页工具也是

rm(list = ls()) 
options()$repos 
options()$BioC_mirror
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos 
options()$BioC_mirror

if (!requireNamespace("BiocManager", quietly = TRUE))
 install.packages("BiocManager")

BiocManager::install('affy')
library(devtools)
install_github("jasdumas/shinyGEO")

这个网页工具开发的很棒,比较容易部署,虽然说,依赖的R包也不少,使用下面的代码批量安装那些缺失的包,如下:

packagesReq <- c("DT",
 "shiny",
 "GEOquery",
 "Biobase",
 "reshape2",
 "survival",
 "shinyBS",
 "GGally",
 "ggplot2",
 "shinyAce",
 "knitr",
 "rmarkdown",
 "RCurl",
 "shinyjs",
 "survMisc",
 "shinyAce",
 "RCurl",
 "shinyBS",
 "shinydashboard",
 "devtools")
packToInst <- setdiff(packagesReq, installed.packages())
packToInst
if(T){
 lapply(packToInst, function(x){
 BiocManager::install(x,ask = F,update = F)
 })
}
lapply(intersect(packagesReq, installed.packages()),function(x){
 suppressPackageStartupMessages(library(x,character.only = T))
})
library(rJava)

大部分,都是shiny相关的R包,非常值得学习,如果确定要走网页开发这条路。

网页工具用法

网页工具部署成功后,使用起来非常简单,输入一个自己需要处理的表达矩阵数据集即可,比如:GSE10009:

image-20191114152830972

实际上就是调用GEOquery包去GEO数据库下载文件,所以这个非常慢,因为中国大陆的网络问题。我以前在生信技能树的芯片万能解决方案里面就有这个解决方案:

欢迎大家提交GEO数据库中国区镜像试用体验,也可以加入交流群:4年前的TCGA重磅资料你学了 这个工具我也准备修改源代码,让它使用我的下载链接,不过这个星期在马来西亚休假,所以不是很想动手去写代码,是时候休息几天了。

image-20191114152751079

有了数据集,接下来使用的分析就中规中矩

image-20191114153017681

首先肯定是分组:

image-20191114153213292

也许是我没有看仔细,并没有全局差异分析,只能是选择某个探针/基因进行处理分析!

而且探针并没有注释到基因,也不可能进行后续的GO/KEGG注释。

该工具的优点

首先,整体页面布局很美观,采用的主题符合我的审美,而且每个功能分步骤安放很容易理解,新的步骤衔接起来比较容易理解。

尤其那些shiny插件包用的出神入化,绝对是初学者宝藏

Comments are closed.