logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

刚刚,DeepSeek V4基准测试泄露!全场惊呼新王归来

另外,DeepSeek V4还引入了新的Engram条件存储系统,实现近乎无限的上下文检索,使其能够处理极长的编码提示,并在大型代码库中保持上下文。但只要通过简单的测试就会发现,这个新版本有一个大突破——超长的上下文窗口,包含100万个token,可以一次性处理《三体》三部曲体量的长文本。知情人士透露,DeepSeek内部的初步基准测试显示,V4在编程任务上的表现已经超越了目前的主流模型,包括Cl

#人工智能
刚刚,Karpathy紧急删库!

研究团队用GPT-4o对900多种职业的19000多项具体任务逐一评估,按照AI能否将任务完成时间缩短一半以上,划分为「无暴露」「直接暴露」「应用暴露」「图像暴露」四个等级,再结合每项任务在岗位中的重要性权重,分别算出每个职业的「自动化得分」和「增强得分」。此外,还有律师(8/10)、数据科学家(9/10)、平面设计师(9/10)、收银员(7/10)等岗位均面临被AI替代的高风险。这类岗位的核心职

#人工智能
DeepSeek V4被爆下周登场

这是一个里程碑式的更新——V3.1首次将V3和R1的能力融合到一个模型中,支持「思考模式」和「非思考模式」的自由切换,在SWE-bench等基准上比前代提升超40%。目前已经在外网疯传的一张对比图显示,DeepSeek V4 Lite(代号「Sealion-lite」)在不开启思考模式的情况下,生成的SVG图像质量已经明显超越了当前的DeepSeek V3.2思考模型。目的很明确——在V4发布前抢

#人工智能
DeepSeek核心成员被爆离职!

还有我们更熟悉的V2、V3和R1,在这个研发过程中,DeepSeek证明了不依赖人工标注的推理轨迹,仅通过纯强化学习,也能把大模型的推理能力激发出来,并自然涌现出自反思、验证、动态策略调整等行为模式。这篇论文主要以程序理解与生成为研究课题,并针对该领域现有研究工作在数据与模型方面存在的问题,提出了基于代码预训练的方法和模型,目的是利用人工智能技术提高软件开发的效率。当时,我的一位师姐在 DeepS

#人工智能
全球首篇!近400篇文献综述!鹏城实验室&中大深度解析具身智能

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【具身智能】交流群添加微信号:CVer111,小助手会拉你进群!扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!转载自:机器之心具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成

#人工智能
医学顶刊Nature Medicine!上海交大盛斌团队提出DeepDR Plus:预测糖尿病视网膜病变进展时间的深度学习系统...

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【医学影像】微信交流群扫码加入CVer学术星球,可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,以及最前沿项目和应用!发论文搞科研,强烈推荐!在CVer微信公众号后台回复:论文,即可下载论文pdf链接!快学起来!转载自:上海交大电院1月4日,上海交通大学电子信息与电气工程学院计算机科学与工程系/教育

#深度学习#人工智能
ECCV 2024|小样本学习新突破!NVIDIA提出:跨领域多模态知识蒸馏动作识别

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【Mamba/多模态/扩散】交流群添加微信号:CVer111,小助手会拉你进群!扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!转载自:多模态机器学习与大模型Multimodal Cross-Domain Few-S

#学习#人工智能#机器学习
清华最新AI工作登上Nature!光神经网络训练!戴琼海院士、方璐教授领衔

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【Mamba/多模态/扩散】交流群添加微信号:CVer111,小助手会拉你进群!扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!转载自:机器之心在刚刚过去的一天,来自清华的光电智能技术交叉创新团队突破智能光计算训练难

#人工智能#神经网络#计算机视觉 +2
NeurIPS 2024 | SynRS3D:最大的合成遥感数据集!用于遥感分割和高度估计等任务

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【Mamba和遥感】交流群添加微信号:CVer111,小助手会拉你进群!扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!转载自:遥感与深度学习论文介绍题目:SynRS3D: A Synthetic Dataset f

#3d#人工智能
ICLR 2025 Oral | Block Diffusion:打通了自回归和扩散模型

与对嵌入进行高斯扩散的替代半自回归方法相比,本文离散方法实现了易于处理的似然估计,并在少一个数量级生成步骤的情况下,生成的样本在困惑度方面得到了改进。研究者表示,开发有效的 BD3-LM 面临以下两个挑战:一是使用神经网络的一次标准前向传递无法有效地计算块扩散模型的训练目标,需要开发专门的算法。结果表明,与之前所有的扩散方法相比,BD3-LMs 实现了最佳的生成困惑度。具体来讲,块扩散模型(也是半

#回归#数据挖掘#人工智能 +2
    共 1256 条
  • 1
  • 2
  • 3
  • 126
  • 请选择