logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RLVR post-train和 RFT在本质上很接近,最主要差异是规模不同 这句话是什么意思

RFT 本质是:模型输出 →人类/模型打分→ 用奖励优化模型RLHF(人类反馈)DPO(偏好学习)PPO(策略梯度)特征RFT奖励来源人 / 偏好数据成本高数据规模小~中泛化受限奖励是“可程序验证的”,不需要人类打分代码是否通过测试 ✔数学题答案是否正确 ✔SQL 是否执行正确 ✔模型输出 →自动验证器 → reward(0/1)特征RLVR奖励来源自动验证成本低数据规模极大可扩展性强。

#人工智能
套壳 AI 估值 20 亿美金:硅谷妖风下的中国式突围

这场估值狂欢背后,藏着的不仅是商业智慧的较量,更是一个关于创新本质的终极拷问 —— 在这个算力即权力、应用即王道的时代,我们是否准备好了重新定义创新的内涵?当我们在嘲笑 "套壳" 时,往往忽略了产品化能力本身就是核心技术 —— 能将散落的技术珍珠串成项链的手艺,从来都是商业世界的顶级稀缺品。这种认知撕裂暴露了全球 AI 竞赛的深层困境:当中国创业者还在用 "全栈自研" 的思维丈量世界时,硅谷早已进

#人工智能
AI 浪潮下的经营效益博弈:拓维信息的机遇与挑战

但硬件销售的毛利率普遍较低,尽管公司算力租赁业务毛利率达 52%,但该业务收入占比仅为 45%,低毛利的硬件销售仍占主导地位,从而拉低了公司整体毛利率,导致公司整体盈利能力承压。通过对其业务结构、非经营性因素以及未来机遇与风险的分析可知,公司若能有效扩大高毛利的算力租赁业务规模,加快鸿蒙业务的市场拓展,同时合理控制成本和风险,有望在未来实现经营效益的改善和业绩的提升。,归属净利润和扣非净利润环比降

文章图片
#人工智能
一文讲明白大模型分布式逻辑(从GPU通信原语到Megatron、Deepspeed)

如果你拿到了两台8卡A100的机器(做梦),你的导师让你学习部署并且训练不同尺寸的大模型,并且写一个说明文档。你意识到,你最需要学习的就是关于分布式训练的知识,因为你可是第一次接触这么多卡,但你并不想深入地死磕那些看起来就头大的底层原理,你只想要不求甚解地理解分布式的基本运行逻辑和具体的实现方法。那么,我来帮你梳理关于大模型的分布式训练需要了解的知识。分布式就是把模型或者数据分散分布到不同的GPU

文章图片
#分布式
罗福莉首秀前,小米突然发布!代码全球最强,总体媲美DeepSeek-V3.2【附实测】

小米凭借混合注意力机制与MOPD等技术创新,大幅优化大模型的研发成本与运行效率;同时开源全部相关成果,有效降低行业研发门槛。此外,近几个月以来,Xiaomi MiMo大模型团队踩下油门,发布数篇论文并开源多个模型。12月5日,小米集团合伙人、总裁卢伟冰透露,公司AI大模型业务过去四个季度投入环比增速超50%,目前进展“已超出董事会预期”,并宣布将AI与“现实世界深度结合”列为未来十年核心战略。同时

#人工智能
一文熟悉具身智能机器人的能量心脏:动力电池,以及国内机器人电池企业

这种改进看似微小,但对于拥有20-40个关节的现代人形机器人而言,累积效应极为可观,当机器人需要连续工作数小时时,这些节省的瓦特数将转化为显著的续航延长。然而,这种电池的热失控风险较高,在机器人可能面临的碰撞、挤压等极端情况下存在安全隐患。特斯拉Optimus已从Gen1的73kg减少至Gen2的63kg,虽然相比其57kg的目标仍有距离,但10kg的减重直接转化为能耗的降低。的三元锂电池压缩在仅

#机器人#java#大数据
万字长文详解:五家主流具身智能开源数据集核心内容

其二,现有数据集整合困难。AgiBot World真机数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过 4000 平方米,包含 3000 多种真实物品,复刻了家居、餐饮、工业、商超和办公五大核心场景,数据集中涵盖的场景具备多样化和多元化特点,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等复杂动作。实验采用官方预训练的VLA模型,在上述所选择的3种类型的机器人上对模型进行

#人工智能
刚刚,DeepSeek公布新论文,R2确定要来了吗?

动态计算优化 论文可能提出在推理阶段动态调整模型计算路径的技术(如条件计算、自适应深度/宽度),根据输入复杂度分配资源,从而在保证精度的同时降低延迟与算力消耗。成本-性能均衡框架 提出量化评估推理效率的指标(如每美元推理吞吐量),并通过自动化工具链实现模型压缩、量化、蒸馏等技术的协同优化,帮助企业在成本与性能间找到最佳平衡。生态适配性 R2的成功依赖于开发者社区的支持与主流框架(PyTorch、T

#人工智能
英伟达四代旗舰GPU全揭露!算力猛兽暴涨900倍,黄仁勋现场连开五炮,刷新DeepSeek世界纪录

作为AI行业风向标,英伟达GTC 2025大会将举办超过1000场会议、汇聚2000名演讲嘉宾和近400家参展商,涵盖大语言模型、物理AI、云计算、科学发现、气候研究、医疗健康、网络安全、人形机器人、自动驾驶等主题,并将举办首届量子日,将汇集全球量子计算界和业内重要人物,与黄仁勋共同探讨量子计算的现状和未来。现场参会者能体验各种精心策划的活动,包括数十场覆盖各个行业的演示、实战培训、自动驾驶汽车展

#人工智能
Qwen2.5-Math 技术报告详细解读

读完感觉,Qwen2.5-Math 是非常扎实的工作,当然,里面涉及到的算力和资源也是一般组不能比拟的,现在看来中文开源主要就 Qwen 和 DeepSeek 两家有能力、有资源了。以上均是我通读后的个人解读,可能有不少疏忽或错误,欢迎指出和探讨。

文章图片
#人工智能
    共 1472 条
  • 1
  • 2
  • 3
  • 148
  • 请选择