whaosoft-143 个人主页

@weixin_49587977

whaosoft-143

2024-09-18 20:05:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

51c大模型~合集185

但另一方面，基于智能体的 AI 能力，要求手机上的模型能够接触人们日常生活中的各类数据，在端侧不断训练，充分理解人们的意图，并 24 小时持续不间断地提供推理结果，这对于手机上的算力提出了前所未有的考验。作为计算架构未来的重要发展方向，存算一体的核心是将存储与计算完全融合，大幅降低数据在处理过程中传输的延迟与功耗，以新的高效运算架构进行二维和三维矩阵计算，结合后摩尔时代先进封装、新型存储器件等技术

#人工智能

51c大模型~合集170

然而，当前的开源 dLLMs 却因一定的技术挑战 —— 例如缺少完善的 KV 缓存机制，以及未充分释放并行潜力 —— 推理速度远慢于同规模的 AR 模型。观察到，当模型的潜在空间从低维（如 4 通道）扩展到更高维（如 16 通道）时，尽管后者能表达更丰富的细节，但也偶发性地出现了一些生成「翻车」的情况（如图 3 所示）。通过建模移动流量在时间、空间、城市环境之间的联合分布，UoMo 在多城市的预

#人工智能

51c大模型~合集131

该算法超越了目前广泛使用的 GRPO 等方法，定义了一个更广泛的算法设计空间，能将 PRIME、DAPO 等方法的优点融合入算法框架中，无需蒸馏超大参数规模模型，便实现了轻中量级（7B/32B）模型推理能力的再提升。值得一提的是，研究人员观察到，在基于 InternBootcamp 的多任务混合训练过程中，出现了强化学习的 “涌现时刻”：在单一任务中，无法成功推理得到奖励的模型，通过多个任务混合的

#人工智能

51c大模型~合集174

在这一套训练范式下，GUI-Owl的框架适配能力显著提升，在没有特意训练过的Mobile-Agent-E和Agent-S2两个第三方框架下，GUI-Owl的效果都能优于Qwen2.5-VL和Seed1.5-VL这些通用模型，同时大幅领先UI-Tars这些GUI专用模型。除此之外，基于多模态大模型的GUI智能体框架凭借出色的表现广受关注，在足够细致的任务拆分下，具备强大推理能力的大模型能够充分发挥自

#人工智能

51c大模型~合集169

虽然上面对于负载均衡设置了很多优化方案，但实际过程中仍没办法做到有效的设备间负载均衡，意味着仍然存在有较多的token集中的少数几个设备上，本文最开始的时候提到过，负载不均衡就需要动态调整容量因子，如果容量因子大于1则专家是可以有buffer来存储一定的token，而如果容量因子为1，则意味着每个设备的专家没有存储计算能力以外token的buffer，这样就会造成这个token溢出，也就是在本层的

#人工智能

51c大模型~合集148

我自己的原文哦~https://blog.51cto.com/whaosoft/14029691Oral工作再升级！上海AI Lab联合复旦、港中文推出支持更长视频理解的最佳工具本文第一作者魏熙林，复旦大学计算机科学技术学院人工智能方向博士生，研究方向是多模态大模型、高效长上下文；目前在上海人工智能实验室实习，指导 mentor 是臧宇航、王佳琦。一、背景介绍虽然旋转位置编码（RoPE）及其变体因

#人工智能

51c视觉~合集28

参数量减少40倍，推理速度提高6倍！结合变形卷积的网络如何克服SSM的内存问题？这篇文章介绍了一种名为UV-Mamba的新型神经网络模型，该模型结合了变形卷积和状态空间模型，用于高分辨率遥感图像中精确检测城市村庄边界。I Introduction城市村庄，作为城市化过程中的历史遗留物，由于其低层建筑和密集的建筑物，不理想的环保条件，以及过时的市政基础设施，在城市建设与经营管理中带来了较大的挑战。城

#人工智能

51c大模型~合集113

此外，无问芯穹异构云大模型服务平台不仅已正式上线满血版 DeepSeek-R1、DeepSeek-V3，且在逐一打通 DeepSeek-R1 在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七个硬件平台上的便捷部署与推理服务，支持通过 Infini-AI 异构云平台一键获取 DeepSeek 系列模型与多元异构自主算力服务，为大家带来更高效、更省心、更划算的 AI 开发和应用体验，欢迎广大开发

#人工智能

51c大模型~合集156

系统识别出结构性片段（如引言、技术解释等），并为其生成了包含口语风格字幕和同步语音的幻灯片，涵盖了「并行化工作流」、「代理系统架构」等技术主题，展示了系统在保持技术准确性的同时，以清晰、对话式方式传达信息的能力。然而，一些 PresentAgent 变体表现出有竞争力的性能。与 paper2poster 的方法类似，我们设计了一个测验式评估框架，即通过视觉语言模型仅根据生成视频（幻灯片+讲解）回答

#人工智能

51c大模型~合集45

环境注入的设定与前文不同。研究团队提出了一个新的研究问题 —— 智能体的环境干扰，和一个新的研究场景 —— 用户和代理都是良性的，环境不是恶意的，但存在能够分散注意力的内容。试想，如果想让机器人快速地端来一杯咖啡，那么需要它肢体的末端执行器快速移动，这意味着在机器人的肢体和齿轮的另一侧，必须有一个转速远远超过末端执行器的电机在运转。然而，屏幕中的广告与用户指令中的购物目的造成了不一致，没有相关的提

#人工智能

共 306 条

请选择