logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

物理学视角讲解diffusion生成模型——数学基础和一维度实现

从物理学的视角来看扩散过程模型。之所以整理这个系列是因为现在大部份讲生成模型的教程都是直接从加噪、去噪、然后代码实现角度来讲。然而为什么要这么加噪、去噪、为什么要高斯拟合,如果我不这么做会怎么样,后续我要优化我的代码要从那下手呢。这些原理层面的东西基本没有讲,这就相当于给了一套生产流程,我们并不知道这套流程是怎么设计背后思想是什么。我们后续碰到问题如果要升级改造这个流程和链路要从何下手呢。要怎么接

文章图片
#人工智能#AIGC#机器学习 +1
知识图谱综述

随着计算资源的廉价和语料知识资源的积累,知识图谱在各大企业逐步开始尝试使用。本文结合王昊奋和漆桂林老师的知识图谱课件以及复旦知识工厂课件,尝试对知识图谱做个综述。目录知识图谱与语义技术概述语义网典型知识库项目简介cyc:常识库Wordnet:词性消歧词库conceptnet:常识知识库freebase:Wikidata:Dbpedia:Yago:Babe...

知识推理

目录  本体知识推理简介与任务分类OWL本体语言知识推理任务OWL本体推理​ 实例化(materialization)的一个例子:OWL本体推理:不一致性检测OWL本体非标准推理:计算辩解 本体推理方法与工具介绍基于Tableaux运算的方法​  Tableaux运算的正确性相关工具简介​ 基于逻辑编程改写的方法相关工具介绍​ RD...

Visual chatgpt多模态大模型的前菜

visual chat将会是多模态大模型一个过渡态,Gpt4以及他的后代一定会用集成电路的模式取代这个分立元器件组成的通用多模态模式。但是它的很多思路是值得我们学习的。

文章图片
#人工智能#python#AIGC
蛋白质科学中的人工智能

AI在生物蛋白质合成中应用

文章图片
#AIGC#人工智能
视觉大模型应该长什么样

1.从现在视觉模型,结合chatgopt的能力发现现在视模型,缺少一个和chatgpt类似的通用大模型2.现在的视觉生成模型框架有望把各种视觉能力汇总到一个框架,发展出类似chatgpt的通用大模型3.展望了通用视觉通用大模型需要具备什么能力4.展望如何通过生成视觉模型框架来统一各种能力,数据和任务搞如何设置5.对现在通用大模型能力,特别是有状态的增删改能力做了些论文小结个人预测真正有通用能力的视

文章图片
#人工智能#深度学习
大模型增量学习 (1)

那么有没可能同时保持模型泛化力有模块化增量增加其他能力,不影响其它能力。我提出的想法是用某块组合方式来实现:1.pretrain保持泛化性2.把pretrain模型参数用更小可控参数矩阵层转换控制3.在可控参数矩阵层之上增加adapter层,这样相当于是pretrain是一个很复杂通用机器,通过控制矩阵引出基础控制算子,然后在通过adapter层作为控制算子编程层,用ssft数据任务调教控制编程层

文章图片
#人工智能#机器学习#语言模型 +2
蛋白质科学中的人工智能

AI在生物蛋白质合成中应用

文章图片
#AIGC#人工智能
分子相互作用的人工智能

利用AI方法来解决分子适配的问题AI解决官能团适配AI解决分子结构对功能生效问题

文章图片
#人工智能#AIGC
AGENTTUNING:为LLM启用广义的代理能力

这篇文章介绍了一种方法,可以让大型语言模型(LLM)具备在多种代理任务上表现出色的能力,缩小了开源和商业LLM在这方面的差距。该方法称为AgentTuning,它包括以下两个步骤:● 首先,构建了一个覆盖多种代理任务的数据集,称为AgentInstruct,它包含了1,866个经过验证的代理交互轨迹,每个轨迹都有一个人类指令和一个代理动作。● 然后,设计了一种指令调优策略,将AgentInstru

文章图片
#AIGC#人工智能#科技 +1
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择