重新GEOmetadb分析发现seq技术实验超过array技术啦
早在3年前我就是菜鸟团博客介绍过GEOmetadb
这个神奇的R包,存储着目前在GEO数据库所有的数据资料,当时我发现最受欢迎的平台是:
GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array
GPL1261 [Mouse430_2] Affymetrix Mouse Genome 430 2.0 Array
比较芯片领域 Affymetrix 公司一家独大,可惜现在也被赛默飞收购了,但其实我开始从事生物信息学的时候已经是ngs技术的天下了,只不过数据处理到发表文章通常相隔3年左右
的时间。
正好,最近又看了看,的确,ngs技术已经成功超过array啦
library(GEOmetadb)
db='/Users/jmzeng/data/project/IDmap/GEOmetadb.sqlite'
if(!file.exists(db)) getSQLiteFile()
file.info(db)
conGEO <- dbConnect(SQLite(),db)
dbListTables(conGEO)
dbListFields(conGEO,"gse_gpl")
tmp1=dbGetQuery(conGEO,"select * from gpl ")
tmp2=dbGetQuery(conGEO,"select * from gse_gpl ")
t1=as.data.frame(table(tmp2[,2]));
colnames(t1)[1]='gpl'
t2=merge(t1,tmp1,by='gpl')[,c(1,2,4,5,10)]
排序可以看到如下: