
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepLink 团队打造首个国产异构算力 PD 分离混合推理方案,通过 PD 分离架构,实现了3款异构芯片的混合推理。此方案利用国产硬件的异构优势,实现 1+1 > 2 的推理效能,为 AI + 制造等场景的规模化落地提供可行路径。

在本篇中,我们转向长期一致性与多轮任务保持这类任务。通过 DeepAgent、Claude Agent SDK 和 MUSE 三条路径,我们看到现代记忆系统正在从“存储”演变为“面向行为链的组织与演化”。真正的 Agent Memory 是一种系统工程,而非单一模块。它牵涉信息表达、结构化组织、检索策略、工具调用链管理、行为一致性维护以及跨会话的经验演化。如何让记忆不仅服务单一任务,还能在更大范围

在本篇中,我们从宏观结构到具体机制,对 Agent Memory 的基础框架进行了系统化梳理。如何在有限上下文中维持有效的短期状态表示;如何在跨会话场景中构建可检索、可复用的长期知识链路。从这些方案中可以看到,Agent Memory 的关键不在于“存得更多”,而在于选择性保留、结构化组织、面向任务的可复用性。REFERENCE[1] [2](2025|NUS&人大&复旦&北大,Agent,L

作者:JMX、TZY、ZSL、YFC from DeepLink Group @ Shanghai AI Lab。

我们使用了逐算子、逐 module 层精度对比工具,以及 loss 曲线比对的方式,排查分析了大模型微调时下游评测精度在 A2 和 CUDA 对不齐的问题。经分析发现和rms_norm存在精度问题,在使用非和使用组合的rms_norm后,loss 曲线可以和 CUDA 对齐,且下游评测任务的平均得分和 CUDA 基本一样。如果你喜欢我们的内容,欢迎我们!也欢迎在评论区与我们互动!你的支持是我们持续

DeepLink团队正式入驻,为大家带来AI 算力、软硬件适配等领域的前沿科技信息和相关讨论。欢迎大家关注并与我们多多讨论!








