
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
该模型创新性地打造了 “重思考模式” ,通过并行推理与深度总结,实现推理宽度与深度的协同扩展,显著提升复杂交互与多步规划任务中的表现。

EvoCUA,一个基于经验进化范式的原生 Computer Use Agent。通过可验证的合成引擎、可扩展的交互基建和可进化的经验学习算法,我们探索出一条提升Computer Use能力的通用方法。在 OSWorld 基准测试中,EvoCUA 以56.7%的成功率刷新了开源模型的 SOTA,证明了这条路径的有效性。高信噪比数据是关键: 成功轨迹是低噪声但低信息量的,失败轨迹是高噪声但高信息量的。

CVPR NTIRE(New Trends in Image Restoration and Enhancement)Workshop 是计算机视觉顶会CVPR下极具影响力的国际学术研讨会,聚焦图像复原、图像增强、生成技术、质量评估的突破性进展。为了促进视频生成技术的持续发展,美团联合上海交通大学在CVPR 2025 NTIRE Workshop上举办XGC质量评价挑战赛(AI Generated
我们正在寻找「AI 狂热分子」——能让搜索结果秒懂用户灵魂需求的算法魔法师、精准雕琢搜索体验的算法工程技术革新者敢用大模型重构搜索逻辑的技术造浪者、深耕算法工程实践的大模型架构驾驭者愿用数据和代码解锁智能边界的未来架构师、用工程代码与数据打破技术边界的技术领航人

本文对美团技术团队在国际顶会CVPR 2025、ICLR 2025中发表的10篇论文进行介绍,这些论文是我们在图像生成、通用视觉分割、多模态文档理解、视频理解大模型、大模型效果评估、大语言模型的对齐和量化方法等方向上的技术沉淀和应用。

今年,CVPR共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%。从录用论文上来看,多模态相关内容仍是关注重点。上海交通大学-美团计算与智能联合实验室发布的论文()也被录用,论文提出了Q-Eval-100K数据集与Q-Eval-Score评估框架。论文致力于解决以下问题:现有的文本到视觉评估数据集存在关键评估维度缺乏系统性、无法区分视觉质量和文本一致性,以及规模不
作为基于 Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video 创新通过 “条件帧数量” 实现任务区分 —— 文生视频无需条件帧、图生视频输入 1 帧参考图、视频续写依托多帧前序内容,原生支持三大核心任务且无需额外模型适配,形成 “文生 / 图生 / 视频续写” 完整任务闭环。同时,从根源规避色彩漂移、画质降解、动作断裂等行业痛点,保障跨帧时

目前美团积极推进AI战略,正研发一款全新的AI Native Product,未来会推出一个覆盖美团餐饮酒旅等所有服务的 AI 助手,致力于让每个人都可以拥有一个专属的生活小秘书。通过美团覆盖全国的消费场景和扎实的履约能力,这款产品不仅能提供信息建议,更能直接落地为真实的服务体验,真正推动 AI 从虚拟交互走向物理世界的需求满足。2025年,我们将聚焦技术影响力突破与业务价值深挖,持续夯实搜索与内

附:议题信息、提案书模板及常见FAQ(
针对大模型知识推理能力与指令遵循能力存在表现差异的现象,为推进指令遵循能力的系统化研究与精准评估,美团 M17 团队推出全新评测基准 Meeseeks,并在魔搭社区、GitHub、Huggingface等开源平台上线。








