logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用Aspera上传数据到SRA

Install下载地址(网上有好多下载地址是错误的):https://downloads.asperasoft.com/en/downloads/8?listtar -zxvf ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.tar./ibm-aspera-connect-3.9.9.177872-linux-g2.12-64找到安装路径,将bin文件

使用python批量下载ensembl数据库指定类型的文件

通过python的ftplib批量下载ensembl中指定类型的文件,并且同一个物种的文件保存在一个文件夹中#/usr/bin/pythonimport ftplibimport osimport time###设置下载路径,下载文件类型HOST='ftp.ensemblgenomes.org'DIRN='/pub/release-50/plants/fasta/'feature_lst=['cd

#python
small RNA seq筛选reads长度

small RNA seq筛选reads长度,以筛选18~25 nt为例pythonfw = open('out', 'w')with open('inp', 'r') as fr:content = fr.readlines()for i in range((len(content) + 1)/4):site = 4 * iif ...

Phytozome通过端口批量下载文件

Phytozome官网提供了四种数据下载方式,前三种为网页操作模式,在此不多介绍,在此主要介绍第四种官方manualDownload with CartDownload with web UIDownload with Globus serviceDownload with APIDownload with API1. 登陆账号curl 'https://signon.jgi.doe.gov/si

python实现根据序列ID从提取fasta文件序列

当序列少的时候,我习惯用 grep -A 1 -f seq.lst seq.fas | sed ‘/^–$/d’ > out.fas提取,但是这次遇到了一个大文件,用grep就太费时了,然后又试了一下TBtools的提取序列功能,发现时间也很长,所以就写了个python。提取将近100万条reads耗时也就需要10s左右#!/usr/bin/python# -*- coding: u

#python
GetOrganelle软件从ngs数据中组装线粒体、叶绿体基因组;GeSeq网站注释细胞系基因组

GetOrganelle安装conda install -c bioconda getorganelleor download from githubunzip GetOrganelle-master.zip;cd GetOrganelle-masterpython setup.py installget_organelle_config.py --add embplant_pt,embplant

到底了