logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

放假前搞大事!DeepSeek 开源 V3.2-Exp,带自主 DSA 稀疏注意力,降 API 价还可本地部署,开发者速冲!

DeepSeek-V3.2-Exp 集成的,是该模型的核心技术创新,其首次实现了细粒度稀疏注意力机制。作为提升大模型处理超长上下文窗口效率的关键技术之一,该机制专注于优化长文本场景下的模型性能。

文章图片
#开源
CVPR2024 | PromptAD: 仅使用正常样本进行小样本异常检测的学习提示

本文提出的PromptAD模型结构如图2所示。PromptAD建立在VV-CLIP之上,其视觉编码器用于提取全局和局部的特征。本文提出的语义串联(SC)用来设计提示。具体来说,将N个可学习的普通前缀与目标名称串联起来获得普通提示(NPs),然后将这N个普通提示分别与M个手动设置的异常后缀和L个可学习的异常后缀串联,以获得N×M个异常提示(MAPs)和N×L个可学习的异常提示(LAPs)。视觉特征和

文章图片
#计算机视觉
一招搞定异构联邦学习难题:FedKTL的超高效策略!

原型生成:每个客户端首先生成类别原型。上传原型:客户端将原型上传到服务器。特征转换器训练:服务器训练一个特征转换器(F),将客户端原型转换为有效的潜在向量。图像生成:服务器使用类别中心潜在向量生成图像,并将图像-向量对分发给客户端。本地训练:客户端使用本地数据和接收到的图像-向量对进行额外的监督学习,增强模型的特征提取能力。

文章图片
#深度学习
GNN携手强化学习!刷爆顶会SOTA,霸榜的28个顶会方案!

图神经网络(GNN)与强化学习(RL)的结合,是一个充满活力的研究领域,它融合了GNN在图数据表示上的深度学习能力和RL在决策过程中的策略优化能力。这种结合为处理具有复杂图结构的数据问题提供了强大的工具。GNN能够深入挖掘图中的模式和关系,而RL则擅长在动态环境中进行序列决策,尤其是在需要长期规划和适应环境变化的情况下。通过将两者结合起来,可以开发出能够同时学习图结构表示和做出最优决策的智能模型。

文章图片
#深度学习
全网最细解读:何恺明新作再战AI生成,入职MIT后首次带队的首篇论文!打破自回归图像生成瓶颈!

文章的核心观点是,尽管自动回归模型在自然语言处理 中取得了巨大成功,但在图像生成领域,它们通常需要将连续的图像数据转换为离散的标记,这一过程 涉及到向量量化。特别是在ImageNet数据集上的256×256分 辨率图像生成任务中,模型能够以每秒不到0.3秒的速度生成图像,并且取得了非常低的Fréchet Inception Distance(FID)得分,这是一个衡量生成图像质量的指标。文章提出了

文章图片
#人工智能
【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

聚焦 embodied AI 领域的全向视觉(360°视觉)技术,系统梳理全向视觉在机器人、工业检测、环境监测等领域的核心价值,分析当前全向视觉生成、感知、理解等方向的技术瓶颈,提出针对性解决方案,同时总结工业需求与学术研究驱动下全向视觉的发展趋势,为相关研究提供清晰的技术路线图。:聚焦阿拉伯语领域,构建大规模阿拉伯语中心的指令与翻译模型,通过针对性的数据构建与模型优化,解决阿拉伯语在多模态模型中

#人工智能#自然语言处理
【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

聚焦 embodied AI 领域的全向视觉(360°视觉)技术,系统梳理全向视觉在机器人、工业检测、环境监测等领域的核心价值,分析当前全向视觉生成、感知、理解等方向的技术瓶颈,提出针对性解决方案,同时总结工业需求与学术研究驱动下全向视觉的发展趋势,为相关研究提供清晰的技术路线图。:聚焦阿拉伯语领域,构建大规模阿拉伯语中心的指令与翻译模型,通过针对性的数据构建与模型优化,解决阿拉伯语在多模态模型中

#人工智能#自然语言处理
【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

聚焦 embodied AI 领域的全向视觉(360°视觉)技术,系统梳理全向视觉在机器人、工业检测、环境监测等领域的核心价值,分析当前全向视觉生成、感知、理解等方向的技术瓶颈,提出针对性解决方案,同时总结工业需求与学术研究驱动下全向视觉的发展趋势,为相关研究提供清晰的技术路线图。:聚焦阿拉伯语领域,构建大规模阿拉伯语中心的指令与翻译模型,通过针对性的数据构建与模型优化,解决阿拉伯语在多模态模型中

#人工智能#自然语言处理
刷爆 AI 圈!DeepSeek-R1 荣登 Nature 封面,梁文锋团队创新训练框架,让大模型靠奖励机制学会高阶推理!

重磅重磅!!DeepSeek-R1 的研究荣登最新一期的!通讯作者正是梁文锋。如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1 模型采用强化学习进

文章图片
#人工智能
刷爆 AI 圈!DeepSeek-R1 荣登 Nature 封面,梁文锋团队创新训练框架,让大模型靠奖励机制学会高阶推理!

重磅重磅!!DeepSeek-R1 的研究荣登最新一期的!通讯作者正是梁文锋。如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1 模型采用强化学习进

文章图片
#人工智能
    共 133 条
  • 1
  • 2
  • 3
  • 14
  • 请选择