logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AReaL v1.0 正式发布:面向 Agent 的全异步强化学习训练框架

我们相信,随着训练框架的持续优化与普及,智能体将逐步跨越“能跑通 Demo”的初级阶段,迈向“持续自主进化”的新阶段。未来,AReaL 团队将持续在系统可用性、训练引擎效率、AI 辅助开发与多模态智能体训练等方向发力,致力于打造面向 Agentic AI 时代的高性能 RL 基础设施。传统的强化学习训练系统多为同步模式,在每一轮训练中需要等待所有推理任务完成后再更新模型,这不仅限制了训练吞吐,也造

文章图片
#人工智能#开源#AI
AReaL v1.0 正式发布:面向 Agent 的全异步强化学习训练框架

我们相信,随着训练框架的持续优化与普及,智能体将逐步跨越“能跑通 Demo”的初级阶段,迈向“持续自主进化”的新阶段。未来,AReaL 团队将持续在系统可用性、训练引擎效率、AI 辅助开发与多模态智能体训练等方向发力,致力于打造面向 Agentic AI 时代的高性能 RL 基础设施。传统的强化学习训练系统多为同步模式,在每一轮训练中需要等待所有推理任务完成后再更新模型,这不仅限制了训练吞吐,也造

文章图片
#人工智能#开源#AI
Dragonfly 论文入选 IEEE TON:AI 领域海量镜像与大模型分发的解决方案

论文设计构建了一个高效、可扩展的 P2P 模型分发系统,该系统是对 CNCF 孵化项目 Dragonfly 的增强,通过多层次设计实现了资源优化与数据同步的有机结合,旨在解决传统 P2P 文件分发系统在面对 AI 大模型(如千亿参数模型)分发的特定挑战时表现不佳的问题。项目官网。

文章图片
#云原生
蚂蚁集团开源移动端流式 Markdown 渲染引擎 FluidMarkdown

在大模型驱动的智能应用时代,AI 生成内容的规模与复杂度持续攀升。无论是对话助手、智能体服务,还是客服系统与知识问答,Markdown 已成为连接 AI 与用户界面的关键桥梁,让信息表达更清晰、更结构化。然而,在移动端原生开发中,想要实现高效、流畅的实时 Markdown 渲染并同时兼顾流式增量输出与灵活样式定制,仍是一项棘手的技术挑战。

文章图片
#开源
智能编程助手 Neovate Code 正式开源

蚂蚁集团支付宝体验技术部正式对外开源智能编程助手 Neovate Code,能够深度理解你的代码库,遵循既有编码习惯,并在上下文感知的基础上,精准地完成功能实现、Bug 修复和代码重构。它集成了 Code Agent 所需的核心能力。目前,Neovate Code 以 CLI 工具的形态提供,但其架构设计高度灵活,未来将支持多种客户端形态,适配更多开发场景。其主要功能包括:对话式开发 - 用于编程

文章图片
#人工智能#开源
AReaL 团队开源 ASearcher 项目,解锁搜索智能体领域的最新突破

ASearcher 项目通过完全异步 RL 训练以及高质量的构造数据,让 agent 通过 RL 训练学会复杂的搜索行为,这伴随着工具使用次数以及输出长度的提升。目前 ASearcher 聚焦于 agentic RL 训练,未来仍有多个方向值得继续探究:多工具接入:ASearcher 目前只使用了两个基本的搜索和网页浏览工具,未来可以接入更多的工具进行RL训练,提升 agent 在复杂任务下的性能

文章图片
#开源#AI
蚂蚁正式开源 LingBot-Depth,基于掩码深度建模的新一代空间感知模型

LingBot-Depth 是一种面向真实场景的深度补全模型,依托奥比中光 Gemini 330 系列双目 3D 相机进行 RGB-Depth 数据采集与效果验证,并基于深度引擎芯片直出的深度数据进行训练与优化,旨在将不完整且受噪声干扰的深度传感器数据转化为高质量、具备真实尺度的三维测量结果,提升环境深度感知与三维空间理解能力,为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉。未来,我

文章图片
#开源#人工智能
蚂蚁正式开源 LingBot-Depth,基于掩码深度建模的新一代空间感知模型

LingBot-Depth 是一种面向真实场景的深度补全模型,依托奥比中光 Gemini 330 系列双目 3D 相机进行 RGB-Depth 数据采集与效果验证,并基于深度引擎芯片直出的深度数据进行训练与优化,旨在将不完整且受噪声干扰的深度传感器数据转化为高质量、具备真实尺度的三维测量结果,提升环境深度感知与三维空间理解能力,为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉。未来,我

文章图片
#开源#人工智能
蚂蚁技术研究院发布推理大模型强化学习框架,邀请开发者共同助力 AGI 生态

可靠地使用 7B 模型进行 R1-Zero 实验,即在 Qwen2.5-7B 模型上运行强化学习训练,观察 thinking token 的涌现以及模型在数学推理任务上的持续改进。首次发布包含了基于 AReaL 系统的可复现实验,涵盖 1.5B 和 7B 参数的 LRM,并在多种计算预算下进行了验证。希望 AReaL 为 AGI 相关领域的研究贡献微薄之力,为更广泛的社区和应用场景提供支持。通过

文章图片
#人工智能#github#开源
智算时代的流量枢纽:蚂蚁 AI Gateway 如何提升大模型推理效能

在进入主题之前,先与大家分享一些关键数据。首先是通义大模型的下载量增长:去年 5 月是 700 万次,8 月突破 2000 万次,至今年 2 月已超 2 亿次,几乎是每三个月翻三倍。一年增长几十倍的业务,可以说是相当快迅猛的增长了。这些主要是去年的数据,那么今年会不会还能这么飞速且持续地增长下去呢?对此,在今年英伟达的 GTC 大会上,英伟达 CEO 黄仁勋表示推理型模型(如 OpenAI O1

文章图片
#人工智能#gateway#开源
    共 13 条
  • 1
  • 2
  • 请选择