生信菜鸟养成手册
背景:生物小本,懂做一些分子实验,了解一些生物背景知识。
目标:成为生信菜鸟,找到一份生物信息学相关的工作。
1、计算机基础(linux+perl+R 或者 python+matlab)
2、生信基础知识(测序+数据库+数据格式)
3、生信研究领域(全基因组,全转录组,全外显子组,捕获目标区域测序)
4、生信应用领域(肿瘤筛查,产前诊断,流行病学,个性化医疗)
分而治之:
- 计算机基础,需要看三本书,一步步的学会学通,不需要刻意去找哪个书,一般linux是鸟哥私房菜,perl是小骆驼咯,R是R in action,但是看一本书只能入门,真正想成为菜鸟,必须每个要看五本书以上!我云盘(http://pan.baidu.com/s/1jIvwRD8)里面有这基本上的高清打印版,大家可以去淘宝打印一下才几十块钱还包邮,对书比较讲究的也可以买正版,也不过是一百多块钱而已!
- 生信基础知识,测序方面,在百度文库找十几篇一代二代三代测序仪资料仔细研读,然后去优酷下载各大主流测序仪的动画讲解,再看看陈巍学基因的讲解;数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC,还有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同样也是百度文库自己搜索资料,但是这次需要自己去官网一个个页面点击看,一个个翻译成中文理解吃透;数据格式讲起了就多了,这个主要是在项目流程中慢慢学,或者你有机会去上课,不然你看来也是立马忘记的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
- 生信研究领域,各个领域主要是软件繁多,合起来常用的估计有上百个软件了,一般只有从业五六年以上的人才有可能把它们全部用过一遍,而且这也完全需要项目来训练,而不能仅仅是看看软件手册,但是研究领域最重要的是背后的原理,需要看各大牛的综述。
- 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
- snp-calling相关软件(bwa,bowtie,samtools,GATK,jar,annovar)
- 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
- 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)
重点:生信应用领域,讲这一块其实已经脱离了生信菜鸟的解释范围了,主要是想说社会上为什么需要搞生信的人才,全是因为在肿瘤筛查,产前诊断,流行病学,个性化医疗等领域有所应用,可以造福人类!!!这方面政策不确定,产业不定型,所以也这绝对是蓝海,但是也绝对不会有现成的资料直接培训人才,我们必须关注各种微信公众号,逛各种测序,医学相关论坛,紧跟业界精英的脚本,同时追着大牛的文献阅读,如此这般才能保住菜鸟的身份!
由windows平台软件(bioedit,DNAstar,genedoc,等可视化软件)转为(blast,blat,samtools,bwa, bowtie 等命令行软件)
学习
共同进步!
谢谢共享