07

阅读文献并下载原始测序数据之helicos转录组数据

阅读文献并下载原始测序数据之helicos转录组数据

目录

  1. 阅读pdf文献,并找到原始数据搜索关键词。
  2. 根据关键词在NCBI的SRA板块搜索找到其下载地址
  3. 根据下载地址写批处理批量下载所有原始测序数据
  4. 用NCBI提供的工具解压SRR数据,还原成fastq格式reads

正文

一、阅读pdf文献,并找到原始数据搜索关键词

tmp164

可以看到它的下载索引是SRP003040,阅读文献可知其包含4种细胞的6种处理方式的转录组数据

Continue reading

07

广播–深圳生物信息兴趣小组

         希望有在深圳的生信从业人员或者学生能看到此广播,我们可以组成兴趣小组交流一下各自所学,或者合作翻译一些技术文档或者制作生信常用软件的使用说明书。
简单介绍一下本人,精通perl和R,勉强可以使用python和matlab,熟练生信的linux环境配置及各大软件的配置。熟练使用基因组及转录组的大部分软件。
现在计划对一些生信入门资料做简单整理,包括以下五个部分内容,及自己的一些随笔。

  • 常用数据库(NCBI,ensembl,UCSC,uniprot,IMGT,KEGG,OMIN,TIGR,GO)
  • 常见数据格式(sam,vcf,gtf,psl,blast-m-8,fa,fq,genbank,bed等)
  • 大型国际计划(1000Genome,hapmap,ENCODE等)
  • 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
  • snp-calling相关软件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
  • 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
  • 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)
  • 外显子组、表观遗传学组、宏基因组相关软件(待定)
  • 计算机基础(linux,perl,R)

         慢慢的我都会把这些制作一个简易介绍文档,如果兴趣小组规模足够大,我们也可以制作精美ppt。希望找到深圳生信朋友我们一起交流,一起合作,一起进步。
因为反正做生信的不用加班,平时跑个代码也不忙,有很多时间可以研究技术,而且这种技术跟着大家一起学是最快的,而且现场交流非常方便,平时周六日什么的大家可以聚会一起玩,最好不要是华大的,不是歧视他们,主要是太偏僻了。
有意者联系我QQ1227278128,或者直接打给我电话也行,15314025716。