logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

51c大模型~合集188

作为迈向下一代架构的过渡,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力机制(DeepSeek Sparse Attention,DSA)—— 一种旨在探索和验证在长上下文场景下训练和推理效率优化的稀疏注意力机制。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Atten

#人工智能
51c大模型~合集112

在 AG2 中,他们设计了一种新颖的搜索算法,可以并行执行多个不同配置的束搜索,并允许它们通过知识共享机制互相帮助,具体可见图 4。他们在 Stable Diffusion,DiT,VAR,LlamaGen,MAR 五个截然不同的视觉架构上进行了验证,一致发现新方法性能与 CFG 相当,而采样成本减半。在图 5 中,他们展示了基于参数量的不同大小的 Gemini 的学习曲线。更快的数据生成可以达成

#人工智能
51c大模型~合集107

我自己的原文哦~https://blog.51cto.com/whaosoft/13140661“尺度定律”之下,大模型除了要突破算力瓶颈,亦面临高质量数据即将“见底”难题。如何通过“通专融合”技术路径实现通用人工智能,正日益成为业内共识。1月15日,上海人工智能实验室对书生大模型进行重要版本升级,书生·浦语3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。仅

#人工智能
51c大模型~合集161

当我们使用方便快捷的卫星网络服务时,就在网络的另一边,一个名叫 “风云太空” 的系统,却平静无声地向这些为我们提供服务的卫星发送了预警信息,一场因太阳爆发活动所带来的冲击即将在大约 24 小时后到达...... 在获取预警信息后,地面运控部门启动应急预案,并在太阳风暴到来时从容应对,化解了此次空间天气危机。第三,他们提出了一个高效的元学习算法,在训练期间使用新语言中的少量标记示例优化跨语言迁移。作

#人工智能
51c大模型~合集161

当我们使用方便快捷的卫星网络服务时,就在网络的另一边,一个名叫 “风云太空” 的系统,却平静无声地向这些为我们提供服务的卫星发送了预警信息,一场因太阳爆发活动所带来的冲击即将在大约 24 小时后到达...... 在获取预警信息后,地面运控部门启动应急预案,并在太阳风暴到来时从容应对,化解了此次空间天气危机。第三,他们提出了一个高效的元学习算法,在训练期间使用新语言中的少量标记示例优化跨语言迁移。作

#人工智能
w~大模型~合集11

总而言之,在论文的最后,哈工大的研究人员表示,在这份全面的综述中,他们对大型语言模型中的幻觉现象进行了深入研究,深入探讨了其潜在原因的复杂性、开创性的检测方法和相关基准,以及有效的缓解策略。虽然开发者们在这个问题上已经有了不少进步,但大型语言模型中的幻觉问题仍然是一个令人关注的持续性问题,需要继续研究。此外,本篇论文还可以作为推进安全可信的AI的指路明灯。哈工大团队表示,希望通过对幻觉这一复杂问题

#人工智能
w~大模型~合集11

总而言之,在论文的最后,哈工大的研究人员表示,在这份全面的综述中,他们对大型语言模型中的幻觉现象进行了深入研究,深入探讨了其潜在原因的复杂性、开创性的检测方法和相关基准,以及有效的缓解策略。虽然开发者们在这个问题上已经有了不少进步,但大型语言模型中的幻觉问题仍然是一个令人关注的持续性问题,需要继续研究。此外,本篇论文还可以作为推进安全可信的AI的指路明灯。哈工大团队表示,希望通过对幻觉这一复杂问题

#人工智能
51c视觉~YOLO~合集14

在智能交通系统领域,实时检测车辆事故的能力变得越来越重要。该项目利用先进的计算机视觉技术,采用最先进的对象检测模型 YOLOv11 来准确识别和分类车辆事故。主要目标是通过向紧急服务提供及时警报并实现更快的响应时间来提高道路安全。YoloV11 是 ultralytics 的 Yolo 最新版本,与以前的版本相比,有几个优点和最大的功能,有关更多信息,请查看官方 ultralytics yoloV

#人工智能
51c大模型~合集153

【AI前沿研究速览】多领域创新成果涌现,大模型与AIAgent技术取得突破性进展 视频生成加速与检测技术 华中科大团队提出EasyCache框架,通过动态缓存机制实现视频扩散模型2.2倍加速 北大与腾讯优图合作开发正交子空间分解方法,显著提升AI生成图像检测泛化能力 大模型开源与创新 月之暗面开源Kimi K2万亿参数模型,在多项基准测试超越GPT-4.1 采用MuonClip优化器解决训练稳定性

#人工智能
51c大模型~合集153

【AI前沿研究速览】多领域创新成果涌现,大模型与AIAgent技术取得突破性进展 视频生成加速与检测技术 华中科大团队提出EasyCache框架,通过动态缓存机制实现视频扩散模型2.2倍加速 北大与腾讯优图合作开发正交子空间分解方法,显著提升AI生成图像检测泛化能力 大模型开源与创新 月之暗面开源Kimi K2万亿参数模型,在多项基准测试超越GPT-4.1 采用MuonClip优化器解决训练稳定性

#人工智能
    共 439 条
  • 1
  • 2
  • 3
  • 44
  • 请选择