数据下载

NCBI上下载SRA数据,首先要知道SRA号 ,找到sra编码的submission, 之后就可以直接在NCBI上的sra选项上搜索

pgn

如图,点击Runinfo会得到excel文件,里面有各个sra文件的下载链接,用windows的下载软件或者linux下的wget, axel下载

sra转fastq格式

do 
 /data1/tangx/software/sratoolkit.2.9.2-ubuntu64/bin/fasterq-dump.2.9.2 --split-3 -e 20 -p ${i}
done  #转换为fastq格式

fasterq-dump 与fastq-dump类似, 重点参数是-e|threads, 用于选择使用多少线程进行运行,默认是6个线程。 同时考虑到有些人容易着急,还提供了-p选项用于显示当前进度

用一个9G大小的文件进行测试

time fastq-dump --split-3 -O test SRR5318040.sra
# 558.76s user 41.36s system 101% cpu 9:51.82 total
time fasterq-dump --split-3 SRR5318040.sra -e 20 -o SRR5318040
# 582.70s user 121.06s system 1130% cpu 1:02.25 total

fastq-dump花了快10分钟,而fasterq-dump只需要1分钟,快了9倍多。

Logo

更多推荐