不知道从哪里拿到了一个上古测序数据,居然是用phred64来代表测序质量分数,可怕,导致我后面的流程报错,所以得先转换过来。结果Google了好久,都没有发现现成的轮子,可能是太简单了吧这个需求,本来想偷懒的。
Category Archives: 基础数据库
不同物种的同一个基因的对应关系
不同物种的同一个基因的对应关系
我们都知道不同的物种在进化过程中其实共享很多基因的,尤其是哺乳动物,同一个基因虽然在不同的物种序列不完全一样,位于的染色体也不一样,发挥的功能可能也稍微有点区别,但是他们的相似性非常高!根据相似性就可以在不同的物种里面找到同一个基因。 Continue reading
lncRNA数据分析传送门
可以参考我们前面组织的3个学习小组:
生信菜鸟团-专题学习目录
转录组专题
生信技能树论坛-生信社区版块-bioconductor中文&shiny交互网页
bioconductor中文
shiny交互网页
今天给大家介绍的是论坛的生信社区版块,包括bioconductor中文和shiny交互网页这两部分。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-研究热点版块介绍(三)-芯片处理
今天我们继续对论坛研究热点版块进行介绍,本文是第三篇,讲的是芯片处理这个热点。本文对热点的内容简单分了下类。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。:)
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-研究热点版块介绍(二)-肿瘤信息学
今天我们继续对论坛研究热点版块进行介绍,本文是第二篇,讲的是肿瘤信息学这个热点。本文分为四部分,第一部分主要介绍TCGA数据下载和整理等方面的内容;第二部分主要介绍肿瘤研究领域一些重要的知识;第三部分为一些比较实用的方法和资讯方面的内容;最后一部分为问答区。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。:)
Continue reading
生信技能树论坛-研究热点版块介绍(一)
三代测序、化学信息学
免疫研究、GWAS
Meta分析、单细胞测序
进化分析、机器学习
今天我们将对论坛研究热点版块进行介绍,本文是第一篇,讲的是开篇提到的这几个热点。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-组学大全版块-转录组&基因组
转录组
基因组
今天我们讲述的是论坛组学大全版块的转录组和基因组。这两个组学,在论坛都有很大不错的内容。比如转录组,今年暑假我们就开展了转录组入门学习活动,有很多人参与,有些朋友还在论坛留下了宝贵的笔记。这些笔记记录了每个参与者的成长过程,作为一个参与者和见证者,我非常感谢和怀念那段时光。关于基因组方面,jimmy大神有个“直播我的基因组”,非常不错。更多详情请看下文吧。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-组学大全版块-蛋白质组&微生物组&代谢组
蛋白质组
微生物组
代谢组
今天我们将对论坛的组学大全版块进行介绍,本文讲述的是蛋白质组、微生物组以及代谢组版块。关于这部分内容,我们有实战分析,有优质笔记,以及一些文献分享,详情请看下文。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-互动作业版块-脚本能力实践&公共资源下载&项目实战
脚本能力实践
公共资源下载
项目实战
本文主要介绍了生信技能树论坛的互动作业版块的三个部分。脚本能力实践,这部分包括perl和Python的一些入门练习题,以及其他一些脚本相关的小技巧;然后是公共资源下载和项目实战这两部分,有介绍数据下载技巧,有介绍ChIP-Seq数据分析实战的,详情请看下文。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
生信技能树论坛-在线应用-大分子表达量数据库&遗传变异资源数据库
遗传变异资源数据库
本文介绍了生信技能树论坛的在线应用版块的大分子表达量数据库和遗传变异资源数据库,因为内容比较少,所以把这两个整合在一起了。内容方面,既有知识总结,又有数据库方面的介绍,还有果子大神以前遗留的待解决问题。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)
厦门大学不再提供R语言镜像
深感遗憾,我以前的教程还特意选择了他,比如下面的安装最新版R语言: Continue reading
生信技能树论坛-组学大全板块-表观组
如果你是最近关注我们,你将又知道一个学习生信的好地方;
如果你是一直关注我们,你肯定对这个地方不陌生;
那就是我们的生信技能树论坛(附上网址:http://www.biotrainee.com/forum.php
本周我们将为大家带来生信技能树论坛-组学大全板块-表观组的介绍:
今天给大家推送:组学大全板块-表观组
作者:中科院-徐鹏
生信技能树论坛的生信基础板块-可视化
如果你是最近关注我们,你将又知道一个学习生信的好地方;
如果你是一直关注我们,你肯定对这个地方不陌生;
那就是我们的生信技能树论坛(附上网址:http://www.biotrainee.com/forum.php)。。)
本周我们将为大家带来论坛-生信基础版块的介绍。
今天给大家推送:可视化版块
作者:钱胜
得到一个物种所有基因的TSS(转录起始位点)区域的bed文件。
首先在UCSC的table browser 里面下载下面这个文件:
CpG Islands记录文件下载的4种方式
这个也是读者来信最多的,关于基因组某些区域的起始终止坐标的下载问题,genomic feature的问题,一般是gtf文件或者bed文件,比如人类hg19上面的所有外显子的坐标记录文件,所有基因的坐标记录文件,所有lncRNA,rRNA等等,我这里拿CpG Islands记录文件下载的4种方式举例子给大家说明一下: Continue reading
用R获取芯片探针与基因的对应关系三部曲-NCBI下载对应关系
这是系列文章,请先看:
用R获取芯片探针与基因的对应关系三部曲-bioconductor
ncbi现有的GPL已经过万了,但是bioconductor的芯片注释包不到一千,虽然bioconductor可以解决我们大部分的需要,比如affymetrix的95,133系列,深圳1.0st系列,HTA2.0系列,但是如果碰到比较生僻的芯片,bioconductor也不会刻意为之制作一个bioconductor的包,这时候就需要自行下载NCBI的GPL信息了,也可以通过R来解决:
##本质上是下载一个文件,读进R里面,然后解析行列式,得到芯片探针与基因的对应关系,看下面的代码,你就能理解了。 Continue reading
吐血推荐snpedia数据库,非常丰富的snp信息记录
mkdir -p ~/annotation/variation/human/dbSNPcd ~/annotation/variation/human/dbSNP## https://www.ncbi.nlm.nih.gov/projects/SNP/## ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh38p2/## ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/nohup wget ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/VCF/All_20160601.vcf.gz &wget ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/VCF/All_20160601.vcf.gz.tbi
用R的bioconductor里面的stringDB包来做PPI分析
PPI本质上是根据一系列感兴趣的蛋白质或者基因(可以是几百个甚至上千个)来去PPI数据库里面找到跟这系列蛋白质或者基因的相互作用关系!