logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【文献阅读】化学空间边缘的分子深度学习

深度学习在药物发现中常因“分布外”(OOD)分子而失效——模型对结构新颖的分子预测不可靠,却可能给出高置信度的错误答案。如何让模型知道自己“没见过”某个分子?2026年《Nature Machine Intelligence》的一项研究给出了答案:不熟悉度(Unfamiliarity)。作者提出联合分子模型(JMM),通过分子SMILES的自编码重构损失量化陌生感,并结合谱聚类主动划分OOD测试集

文章图片
#深度学习#人工智能#论文阅读
CD-HIT 详解:序列去冗余、安装使用与聚类结果解析

CD-HIT是一款高效的生物序列聚类工具,通过贪心算法和局部敏感哈希快速将相似序列分组。它通过设置相似度阈值(如0.4-0.9)来降低数据冗余,在蛋白质相互作用预测中尤为重要,能防止模型通过记忆相似序列而非学习互作模式导致的评估偏差。

文章图片
#聚类#数据挖掘#机器学习 +3
解析DrugBank数据库数据|Python

DrugBank是一个综合性的生物信息学和化学信息学数据库,专门收录药物和靶点的详细信息。它由加拿大阿尔伯塔大学的Wishart 研究组维护,提供化学、药理学、相互作用、代谢、靶点等多方面的药物数据。DrugBank 结合了实验数据和计算预测,广泛应用于药物研发、精准医疗、生物信息学研究等领域。

文章图片
#数据库
学习GTEx数据库

组织类型(54):GTEx数据库简介(1) - 知乎 (zhihu.com)TCGA、ICGC、GTEx 数据库都是啥?- 知乎 (zhihu.com)GTEx:基因型和基因表达量关联数据库-CSDN博客。

文章图片
#数据库#学习
【文献阅读】PPLM——让语言模型真正“理解“蛋白质之间的对话

在AI for Science领域,一项来自新加坡国立大学的研究重磅登陆《自然·通讯》,为蛋白质-蛋白质相互作用预测带来了范式转变。传统单链蛋白质语言模型(如ESM2)虽强,却像是训练“独行侠”,无法从根本上理解两个蛋白如何协同工作。为此,研究者提出了 PPLM​ —— 一个开创性的蛋白质配对语言模型。PPLM的核心革命在于其联合编码的预训练方式。它通过独创的混合链内/链间注意力机制,在模型底层就

文章图片
#语言模型#人工智能#自然语言处理
【文献阅读】MINT:让AI“学会”蛋白质对话的语言,开启相互作用预测新时代

不再满足于看懂单个蛋白质,新一代蛋白质语言模型MINT通过跨链注意力机制,直接从海量序列中学习蛋白质之间如何“握手”与“交谈”,在抗体设计、癌症突变解读、病毒免疫逃逸预测等领域大放异彩。

文章图片
#论文阅读
【文献阅读】PPLM——让语言模型真正“理解“蛋白质之间的对话

在AI for Science领域,一项来自新加坡国立大学的研究重磅登陆《自然·通讯》,为蛋白质-蛋白质相互作用预测带来了范式转变。传统单链蛋白质语言模型(如ESM2)虽强,却像是训练“独行侠”,无法从根本上理解两个蛋白如何协同工作。为此,研究者提出了 PPLM​ —— 一个开创性的蛋白质配对语言模型。PPLM的核心革命在于其联合编码的预训练方式。它通过独创的混合链内/链间注意力机制,在模型底层就

文章图片
#语言模型#人工智能#自然语言处理
【python】AAindex的氨基酸理化属性提取

AAindex是一个包含氨基酸理化特性数值指标的数据库,分为AAindex1(氨基酸指标)、AAindex2(突变矩阵)和AAindex3(蛋白质接触势)三部分。aaindex软件包提供轻量级访问AAindex1数据的功能,无需额外安装库。使用方法简单:安装后通过Python代码即可获取氨基酸指标数据,并支持转换为DataFrame格式进行排序和保存。目前仅支持AAindex1,未来将扩展支持其他

文章图片
#python
部署“曙光”服务器深度学习环境

(1)阅读相关文档(2)Anaconda 安装(3)pip install torch出现如下的错误:依据提示添加了各种channels,但还是失败,然后想到了手动下载torch安装包,还是出错:于是乎,重新安装anaconda并新建环境安装annaconda下载链接:Anaconda | Individual Editionhttps://www.anaconda.com/products/in

#pytorch#深度学习#linux +1
【文献阅读】DP-Site:一种基于双重深度学习的蛋白质-肽相互作用位点预测方法

研究团队开发了一款名为DP-Site的AI工具,仅需分析蛋白质的氨基酸序列(“设计图”),就能精准锁定小分子药物的潜在“靶点”。DP-Site的核心创新在于其 “双专家会诊”模式。一位是“图像专家”,擅长分析序列的局部结构特征;另一位是“语义专家”,擅长理解序列的全局上下文信息。两者协同工作,使其预测综合性能(F1分数)达到0.661,超越此前所有方法。

文章图片
#论文阅读
    共 24 条
  • 1
  • 2
  • 3
  • 请选择