一.阅读文献找到SRP
该文献讲了单分子测序在医疗领域的一个应用,我感觉挺重要的,就分析了一下,然后下载了数据,准备处理一下。
Single-step capture and sequencing of natural DNA for detection of BRCA1 mutations
在NCBI查到该数据地址,并且用脚本下载即可
http://www.ncbi.nlm.nih.gov/sra/?term=SRP007097
下载之后的数据如下,共19个测序文件,都是200K左右大小,那两个一百多M的可能是下载错了
for i in {32..52}
do
wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR258/SRR2588$i/SRR2588$i.sra
Done
下载的19个数据,都是只有1万多条序列。
因为这些判断都是对BRCA1这个基因进行目标性测序,所以接下来需要对它们进行特殊的处理。