logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CleaveLand--降解组测序数据分析

需要准备的数据:降解组测序数据QC后整理为redundant fasta格式转录本数据,fasta格式miRNA序列,fasta格式查看帮助文档CleaveLand4.pl --helpreadscount转为fasta格式(redundent reads)从NCBI下载的测序数据很多是去过接头的,并且整理成readscount格式,即每行第一列为reads,第二列为read...

从植物sRNA-seq数据中de novo预测miRNA的工具--miRDeep-P2

使用miRDeep-P2从sRNA-seq数据中de novo预测miRNA

使用Aspera上传数据到SRA

Install下载地址(网上有好多下载地址是错误的):https://downloads.asperasoft.com/en/downloads/8?listtar -zxvf ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.tar./ibm-aspera-connect-3.9.9.177872-linux-g2.12-64找到安装路径,将bin文件

使用python批量下载ensembl数据库指定类型的文件

通过python的ftplib批量下载ensembl中指定类型的文件,并且同一个物种的文件保存在一个文件夹中#/usr/bin/pythonimport ftplibimport osimport time###设置下载路径,下载文件类型HOST='ftp.ensemblgenomes.org'DIRN='/pub/release-50/plants/fasta/'feature_lst=['cd

#python
small RNA seq筛选reads长度

small RNA seq筛选reads长度,以筛选18~25 nt为例pythonfw = open('out', 'w')with open('inp', 'r') as fr:content = fr.readlines()for i in range((len(content) + 1)/4):site = 4 * iif ...

python实现根据序列ID从提取fasta文件序列

当序列少的时候,我习惯用 grep -A 1 -f seq.lst seq.fas | sed ‘/^–$/d’ > out.fas提取,但是这次遇到了一个大文件,用grep就太费时了,然后又试了一下TBtools的提取序列功能,发现时间也很长,所以就写了个python。提取将近100万条reads耗时也就需要10s左右#!/usr/bin/python# -*- coding: u

#python
GetOrganelle软件从ngs数据中组装线粒体、叶绿体基因组;GeSeq网站注释细胞系基因组

GetOrganelle安装conda install -c bioconda getorganelleor download from githubunzip GetOrganelle-master.zip;cd GetOrganelle-masterpython setup.py installget_organelle_config.py --add embplant_pt,embplant

到底了