logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

可验证过程奖励在提升大模型推理效率中的探索与实践

美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。

文章图片
#人工智能
LongCat-Flash:如何使用SGLang部署美团Agentic模型

SGLang 团队是业界专注于大模型推理系统优化的技术团队,提供并维护大模型推理的开源框架SGLang。近期,美团M17团队与SGLang团队一起合作,共同实现了LongCat-Flash模型在SGLang上的优化。欢迎大家体验。

文章图片
#人工智能
美团智能头盔研发实践系列02:软件功能篇

本文系《美团智能头盔研发实践系列》的第二篇文章,围绕智能头盔如何通过主动安全和被动安全相结合的方式有效保护骑手,主要包括智能头盔骑行通话质量强化、智能语音助手、碰撞摔倒监控等三项软件能力。

文章图片
#智能硬件
美团大模型北斗实习计划2025 FAQ

此外,同学们可以登录美团校招官网,进入“投递记录”查看招聘进展,也可以通过“美团招聘”公众号,点击下方的“校招主页”按钮,侧边栏点击“个人中心”,查看招聘进展。A3:大模型北斗实习计划是针对大模型领域的头部人才实习计划,可体验真实业务场景、海量数据和计算资源,并与美团最优秀研究者深度结对,获得一对一科研指导,联合发表高水平论文、申请专利等。A11:原则上,同学们在实习过程中不得退出项目,如因自身原

美团开源LongCat-Audio-Codec,高效语音编解码器助力实时交互落地

针对 Speech LLM 落地中的音频处理难题,美团 LongCat 团队正式开源专用语音编解码方案 LongCat-Audio-Codec。真正让语音大模型既 “听懂” 语义,又能够“说清” 。

文章图片
#开源
美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律

该基准通过科学的评测框架,首次揭示了多模态智能并非简单的线性叠加,而是遵循着一种乘积规律,这一规律在能力较弱的模型上体现为瓶颈限制,而在顶尖模型上则表现为协同增益的特性,这个全模态大模型的“组合定律”为行业提供了一种全新的、跨越模型规模的分析范式。为实现自动化评估,LongCat团队还提出了一个通用评分模型,通过对问题类型进行细分(如图7所示),并结合人工和自动标注多轮质量迭代的数据集(如图6所示

文章图片
#人工智能
2025 | 美团大模型学术论文精选

美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。本文精选美团技术团队在大模型方向沉淀的最新学术论文,内容覆盖大语言模型、大模型系统与架构优化、多模态理

VitaBench:基于复杂生活场景的交互式 Agent 评测基准

美团 LongCat 团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark)。VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含 66 个工具的交互式评测环境,并进行了跨场景的综合任务设计。

文章图片
#生活
美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA

美团 LongCat 团队正式发布并开源 LongCat-Image 模型,通过高性能模型架构设计、系统性的训练策略和数据工程,以6B参数规模,成功在文生图和图像编辑的核心能力维度上逼近更大尺寸模型效果,为开发者社区与产业界提供了 “高性能、低门槛、全开放” 的全新选择。

文章图片
#人工智能
MTGR:美团外卖生成式推荐Scaling Law落地实践

美团外卖推荐算法团队基于HSTU提出了MTGR框架以探索推荐系统中Scaling Law。MTGR对齐传统模型特征体系,并对多条序列利用Transformer架构进行统一建模。通过极致的性能优化,样本前向推理FLOPs提升65倍,推理成本降低12%,训练成本持平。

文章图片
#人工智能
    共 139 条
  • 1
  • 2
  • 3
  • 14
  • 请选择