题目

  • HPV(human papillomavirius)是人乳头瘤病毒,具有多个亚型,闲着没事,研究一下

下载序列

  • 从NCBI下载,ftp网址是:ftp://ftp.ncbi.nlm.nih.gov/genomes/Viruses/,在Linux下使用lftp工具下载。
  • 首先,登陆ftp,然后可以用ls查看当前文件夹下的目录和文件,包含了所有种类的viruse的目录,每个目录里面是对应的病毒的序列文件等。
lftp ftp://ftp.ncbi.nlm.nih.gov/genomes/Viruses/
  • 然后,下载所有papillomavirus相关的文件夹下的文件,mget是批量下载命令,-c 支持断点续传,-d 创建相应的目录,-O 输出目录。由于文件较多,下载比较慢。
mget -c -d -O  ~/database/HPV/ ./*papillomavirus*/* 

寻找HPV的各种亚型的基因组序列并整合

  •  
Logo

更多推荐