马拉AI 个人主页

@Mikasa33

马拉AI

2023-04-27 12:24:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

放假前搞大事！DeepSeek 开源 V3.2-Exp，带自主 DSA 稀疏注意力，降 API 价还可本地部署，开发者速冲！

DeepSeek-V3.2-Exp 集成的，是该模型的核心技术创新，其首次实现了细粒度稀疏注意力机制。作为提升大模型处理超长上下文窗口效率的关键技术之一，该机制专注于优化长文本场景下的模型性能。

#开源

CVPR2024 | PromptAD: 仅使用正常样本进行小样本异常检测的学习提示

本文提出的PromptAD模型结构如图2所示。PromptAD建立在VV-CLIP之上，其视觉编码器用于提取全局和局部的特征。本文提出的语义串联（SC）用来设计提示。具体来说，将N个可学习的普通前缀与目标名称串联起来获得普通提示（NPs），然后将这N个普通提示分别与M个手动设置的异常后缀和L个可学习的异常后缀串联，以获得N×M个异常提示（MAPs）和N×L个可学习的异常提示（LAPs）。视觉特征和

#计算机视觉

一招搞定异构联邦学习难题：FedKTL的超高效策略！

原型生成：每个客户端首先生成类别原型。上传原型：客户端将原型上传到服务器。特征转换器训练：服务器训练一个特征转换器（F），将客户端原型转换为有效的潜在向量。图像生成：服务器使用类别中心潜在向量生成图像，并将图像-向量对分发给客户端。本地训练：客户端使用本地数据和接收到的图像-向量对进行额外的监督学习，增强模型的特征提取能力。

#深度学习

GNN携手强化学习！刷爆顶会SOTA，霸榜的28个顶会方案！

图神经网络（GNN）与强化学习（RL）的结合，是一个充满活力的研究领域，它融合了GNN在图数据表示上的深度学习能力和RL在决策过程中的策略优化能力。这种结合为处理具有复杂图结构的数据问题提供了强大的工具。GNN能够深入挖掘图中的模式和关系，而RL则擅长在动态环境中进行序列决策，尤其是在需要长期规划和适应环境变化的情况下。通过将两者结合起来，可以开发出能够同时学习图结构表示和做出最优决策的智能模型。

#深度学习

全网最细解读：何恺明新作再战AI生成，入职MIT后首次带队的首篇论文！打破自回归图像生成瓶颈！

文章的核心观点是，尽管自动回归模型在自然语言处理中取得了巨大成功，但在图像生成领域，它们通常需要将连续的图像数据转换为离散的标记，这一过程涉及到向量量化。特别是在ImageNet数据集上的256×256分辨率图像生成任务中，模型能够以每秒不到0.3秒的速度生成图像，并且取得了非常低的Fréchet Inception Distance（FID）得分，这是一个衡量生成图像质量的指标。文章提出了

#人工智能

【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

聚焦 embodied AI 领域的全向视觉（360°视觉）技术，系统梳理全向视觉在机器人、工业检测、环境监测等领域的核心价值，分析当前全向视觉生成、感知、理解等方向的技术瓶颈，提出针对性解决方案，同时总结工业需求与学术研究驱动下全向视觉的发展趋势，为相关研究提供清晰的技术路线图。：聚焦阿拉伯语领域，构建大规模阿拉伯语中心的指令与翻译模型，通过针对性的数据构建与模型优化，解决阿拉伯语在多模态模型中

#人工智能 #自然语言处理

【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

#人工智能 #自然语言处理

【9.19日报】计算机科学、人工智能、自然语言处理、多模态技术、医学信息学等多个领域

#人工智能 #自然语言处理

刷爆 AI 圈！DeepSeek-R1 荣登 Nature 封面，梁文锋团队创新训练框架，让大模型靠奖励机制学会高阶推理！

重磅重磅！！DeepSeek-R1 的研究荣登最新一期的！通讯作者正是梁文锋。如果训练出的大模型能够规划解决问题所需的步骤，那么它们往往能够更好地解决问题。这种与人类处理更复杂问题的方式类似，但这对人工智能有极大挑战，需要人工干预来添加标签和注释。在本周的期刊中，DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型，并使其进行推理。DeepSeek-R1 模型采用强化学习进

#人工智能

刷爆 AI 圈！DeepSeek-R1 荣登 Nature 封面，梁文锋团队创新训练框架，让大模型靠奖励机制学会高阶推理！

#人工智能

共 133 条

请选择