logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【文献分享】HydraRNA:一种基于混合架构的全长 RNA 语言模型

RNA 是分子生物学中心法则的重要组成部分,在所有细胞过程中都发挥着多种作用。RNA 大规模语言模型(LLM)作为 RNA 研究中强大的方法,有助于解析其复杂的功能和调控网络。然而,之前的 RNA LLM 通常基于 Transformer 模型,并且是基于短片段的非编码 RNA 进行预训练的,这限制了它们的通用适用性。在此,我们介绍了首个全长 RNA 基础模型——HydraRNA,它基于双向状态空

文章图片
#语言模型#人工智能#自然语言处理
【文献分享】TransBrain:一种用于在人类与小鼠之间转换全脑表型的计算框架

尽管全脑成像技术取得了进步,但缺乏能够将啮齿动物临床研究与人类研究联系起来的定量方法仍然是一个关键的挑战。在此,我们推出了 TransBrain,这是一个计算框架,能够实现人类和小鼠大脑整体表型的双向转换。TransBrain 通过以下方式提高了人类与小鼠同源性映射的准确性:(1)一个基于皮质和皮质下分离区域的特定深度神经网络,该网络基于整合的多模态人类转录组学进行训练,以改善皮质对应关系(比原始

文章图片
#数据分析#数据挖掘#数据可视化
【文献分享】vConTACT3机器学习能够实现可扩展且系统的病毒分类体系的构建

尽管病毒生态基因组学扩大了对病毒世界的探索范围和理解程度,但现有的分类工具在分类学分辨率方面存在不足,无法适用于现代基于发现的数据集或对先前未知的序列空间进行分类。在此,我们开发了 vConTACT3——一个基于机器学习的工具,它提高了病毒分类的可扩展性和准确性。通过优化基因共享阈值并利用适应性的、特定领域的分界线,vConTACT3 扩展了分类范围,涵盖了六个正式认可的领域中的四个,对真核和原核

文章图片
#机器学习#人工智能#数据挖掘 +2
【文献分享】COSIME:具有可扩展性和可解释性模型解释器的协同多视角整合

单组学方法往往只能对复杂的生物系统提供有限的视角,而多组学整合则能够通过整合各种数据视角来实现更全面的理解。然而,整合不同类型的异质数据以及解析生物特征(包括同一视角和不同视角之间)之间的复杂关系仍然是一个重大挑战。在此,为应对这些挑战,我们引入了 COSIME(具有可扩展性和可解释模型解释器的协同多视角整合)。COSIME 将可学习的最优传输算法的反向传播应用于深度神经网络,从而能够从多个视角学

文章图片
#数据分析#数据挖掘
【工具】survex一个解释机器学习生存模型的R包

【工具】survex一个解释机器学习生存模型的R包

文章图片
#机器学习#r语言#人工智能 +3
【文献分享】NOODAI:一款用于网络导向型多组学数据分析及整合流程的网络服务器

组学分析已被证明在无偏且全面地识别定义生物表型和潜在医学状况的关键特征方面具有重要作用。每种组学分析都能帮助对与所研究表型相关的特定分子成分进行特征描述,而它们的联合评估则能为生物系统的整体机制运作提供更深入的见解。在此,我们介绍了一种方法,即从每个组学分析中获得的代表性特征(例如差异表达的元素)出发,构建并分析联合交互网络。所得到的网络基于生物实体之间可靠交互的现有知识。我们利用这些图谱来识别和

文章图片
#数据分析#数据挖掘#r语言
【工具】Eclipse:一个用于对两个或多个非靶向液相色谱-质谱代谢组学数据集进行比对的 Python 软件包

【工具】Eclipse:一个用于对两个或多个非靶向液相色谱-质谱代谢组学数据集进行比对的 Python 软件包

文章图片
#python#数据分析#数据挖掘
工具:如何从NCBI下载SRA数据

如何使用sra tools从NCBI下载SRA数据

文章图片
#数据挖掘
数据分析:RNA-seq数据的批次校正方法

转录组数据多来源的批次效应校正方法总结

文章图片
#数据分析#数据挖掘#r语言
数据分析:广义估计方程和混合线性模型的实现

纵向数据统计方法,广义估计方程和混合线性模型

文章图片
#数据分析#r语言#数据挖掘 +1
    共 19 条
  • 1
  • 2
  • 请选择