阅读文献并下载原始测序数据之helicos转录组数据

欢迎加群201161227，线下交流-深圳大学城

阅读文献并下载原始测序数据之helicos转录组数据

目录

    阅读pdf文献，并找到原始数据搜索关键词。
    根据关键词在NCBI的SRA板块搜索找到其下载地址
    根据下载地址写批处理批量下载所有原始测序数据
    用NCBI提供的工具解压SRR数据，还原成fastq格式reads

正文

一、阅读pdf文献，并找到原始数据搜索关键词

可以看到它的下载索引是SRP003040，阅读文献可知其包含4种细胞的6种处理方式的转录组数据

二、根据关键词在NCBI的SRA板块搜索找到其下载地址

tmp240

三、  根据下载地址写批处理批量下载所有原始测序数据

解析SRA地址可知从SRR133571.sra到SRR133639.sra，共69个文件

批处理代码如下：

    while read id
    do
    echo $id
    wget  ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR133/$id/$id.sra
    done <$1

下载之后共14G的数据

tmp460

四、用NCBI提供的工具解压SRR数据，还原成fastq格式reads

也是批处理进行解压，代码如下

    for i in *sra
    do
    /home/jmzeng/bio-soft/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump –split-3 $i
    Done

解压后共216G的数据，都是fastq格式的单端50bp的数据。

此文的引用地址:

GB2312 http://www.bio-info-trainee.com/tmp/o-blog/trackback.php?id=3&encode=gb2312

UTF-8 http://www.bio-info-trainee.com/tmp/o-blog/trackback.php?id=3&encode=utf-8

1 Trackback Pings

# 1: October 21, 2023, 8:32 pm, keyXmSK94jfdsjugerhjg, keyXmSK94jfdsjugerhjg said:

conXmSK94jfdsjugerhjg

添加评论

www.phpBlog.cn

分类

搜索