logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用MAKER进行基因注释(高级篇之AUGUSTUS模型训练)

准备训练集和测试集根据Augutus的官方教程,可靠的基因结构序列的要求如下:提供基因的编码部分,包含上游几KB。通常而言,基因越多,效果越好,至少准备200个基因以上。还得保证这些基因中要有足够多的外显子,这样子才能训练内含子。这些基因的基因结构一定要足够的准确。不过,也不需要百分百的正确,甚至注释都不需要特别的完整,只要保证起始密码子和终止密码子的准确是准确的即可。需...

使用MAKER进行基因注释(高级篇之GeneMark-ET模型训练)

GeneMarkGeorgia Institute of Technology开发的一系列基因预测工具。真核生物基因组预测主要会用到GeneMark-ES/ET, 其中GeneMark-ES可用于无监督自训练,也就是只要提供一个基因组序列即可,而GeneMark-ET则是在GeneMark-ES的基础上整合了高通量的RNA-Seq转录本数据,工作流程如下工作流程如果...

「三代组装」Pacbio组装后如何用自身数据进行polish

三代数据由于其高错误率(目前应该是10%左右), 即便在组装前有一步纠错环节,但是组装得到序列依旧存在着许多错误,因此需要进行polish环节。polish分为两个层次,三代原始序列polish和二代序列polish。其中三代纠错这一步速度会很慢,所以有些人会选择直接用二代序列进行纠错。(从我个人项目经验来看,直接用二代纠错的效果和先三代再二代区别并没有那么显著,也有可能是我的项目...

如何向NCBI的SRA上传数据

首先访问SRA的提交界面,https://submit.ncbi.nlm.nih.gov/subs/sra/,在没有登陆NCBI时,网页内容如下所示未登录时点击Log in, 会进入一个新的网页用于登陆或者创建新的NCBI账户。登陆NCBI在创建完账号或者登陆之后,返回之前的SRA上传页面,界面就变成了如下。登陆后他提示了有三种方法可...

基因家族扩张收缩分析可视化(CAFE5)

CafePlotter 是一个用于可视化 CAFE5 基因家族扩张收缩分析结果的 Python 工具

文章图片
让GPT替我写vue3代码,看的我血压升高

语言模型,每次都是输出他认为概率最大的一个

文章图片
#vue.js#javascript
如何用软件模拟NGS数据

如何用软件模拟NGS数据为了评价一个工具的性能,通常我们都需要先模拟一批数据。这样相当于有了参考答案,才能检查工具的实际表现情况。因此对于我们而言,面对一个新的功能,可以先用模拟的数据测试下不同工具的优缺点。有如下几个工具值得推荐一下:'wgsim/dwgsim': 从全基因组中获取测序reads'msbar': EMBOSS其中一个工具,能够从单个序列中...

#python#java#linux +2
Windows基于WSL搭建Python数据分析环境

最近配置了一台较为不错的台式机,记录下自己配置环境的过程。安装WSL,提供Linux环境如果你发现后续的命令无法运行或者说软件商城中找不到,这可能意味着你的操作系统不符合要求。WSL安装要求 Windows 10 version 2004(Build 19041 )及以上,或者是Windows11.以管理员身份(也就是右击命令提示符)打开Windows下的CMD或PowerShell(后续,我们统

文章图片
#windows#python#数据分析
「单细胞转录组系列」使用scCATCH进行聚类结果自动化注释

目前该软件只支持Mouse和Human,不支持其他物种,因此不是这两个物种的小伙伴可以不用看了。scCATCH全称是single cell Cluster-based Annotation Toolkit for Cellular Heterogeneity,是一个用于实现单细胞转录组聚类结果进行注释的工具。软件核心函数是和scCATCH,findmarkergenes则是辅助用于寻找标记。...

「nature protocols」组学数据的通路富集分析和可视化: g:Profiler, GSEA, Cytoscape 和 EnrichmentMap...

nature protocols上发了一篇文章,题目为"Pathway enrichment analysis and visualization of omics data using g:Profiler, GSEA, Cytoscape and EnrichmentMap", 手把手将哪些只会实验的人如何通过点击鼠标的方式学会通路分析,挖掘他们高通量测序结果,包括转录组, 基...

    共 77 条
  • 1
  • 2
  • 3
  • 8
  • 请选择