容器魔方个人主页

@2301_80396997

容器魔方

2023-10-23 10:25:28 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

华为云ModelArts AI云服务入选2025年人工智能应用典型案例

7月14日，工业和信息化部办公厅公布“2025年人工智能应用典型案例入选名单”。本次评选旨在推进人工智能赋能新型工业化，打造行业应用标杆。同时，通过加大对典型案例的支持力度，加快推动优秀成果规模化应用。“华为云ModelArts AI云服务加速大模型产业化”入选典型案例。其通过技术创新力、场景精准洞察及实践成效，持续推进大模型落地与产业化进程，对行业具有重要借鉴与推广价值。

#人工智能 #容器 #云计算 +1

普惠 DeepSeek-V4：Kthena + 昇腾 3 分钟搭建 PD 分离推理

本文将详细介绍如何通过Kthena控制器，在昇腾NPU上部署DeepSeek-V4-Flash模型，完成P/D分离的实践。我们会深入解析P/D分离的技术原理、Kthena的编排能力，以及ModelRoute如何实现P/D实例的自动发现与KV传输协作。

#云原生 #容器 #云计算 +1

Kthena × Mooncake：在昇腾集群解锁高效的分布式推理与 KVCache 复用

随着大模型向长上下文和复杂推理任务演进，Prefill-Decode分离架构已成为提升集群整体吞吐量的标准实践。作为一款云原生环境下的分布式推理负载编排引擎，Kthena 在 v0.4.0 版本中已全面支持基于 vLLM 和 Mooncake 的 PD 分离部署，并深度针对华为昇腾（Ascend）NPU 集群进行了硬件级优化。

#分布式

Kthena × Mooncake：在昇腾集群解锁高效的分布式推理与 KVCache 复用

#分布式

从生成到协同：AI编程如何重塑企业研发生态

近日，在2026华为云INSPIRE创想者大会上，华为云携手AiDD联合举办了“AI Coding 时代：开发者与Agent的协同进化”论坛，企业级AI研发能力的落地路径成为热议的焦点。专家们一致表示AI Coding正跨越“能否生成代码”的初级阶段，全面迈向深度参与和协同完成软件交付”的产业深水区。

#算法 #人工智能 #容器 +2

一文读懂分布式 Agent Swarm：让智能体团队真正跨节点协作

人工智能技术应用已走向深水区，AI 智能体面对的任务复杂度正呈指数级上升。如何保障多个 Agent 在高压场景下稳定分工、高效协同并精准执行？这已成为多智能体系统落地生产环境的核心瓶颈。为了攻克这一难题，openJiuwen 持续深耕Coordination Engineering（协同工程）领域。

#云原生 #人工智能 #容器 +3

云原生 Agent 托管的高效范式：Agent Harness Infra 体系化设计

本文聚焦华为云Agent Harness Infra云原生托管体系，阐述其在 AI Agent 规模化落地中的核心价值，剖析冷启动延迟、状态持久化、执行安全三大痛点，并给出完整基础设施解决方案，同时展望面向 AI Agent 与 Serverless 场景的轻量化、极速启动、安全隔离的云原生沙箱演进方向，助力企业构建高可靠、低成本、易治理的智能服务运行底座，加速 AI 代理从原型走向生产级应用。

#云原生 #云计算 #容器 +1

Kubernetes 跑 AI Agent，缺的不只是算力——AgentCube 补上了什么

一次典型的 Code Interpreter 调用，往往从一个很小的动作开始：用户点击“运行代码”。但在一个原生 Kubernetes 环境中，这个动作背后通常意味着一整套秒级链路：调度 Pod、分配网络、拉取镜像、启动容器。对于需要多步推理、频繁调用工具、强依赖交互体验的 AI Agent 应用来说，这样的启动路径并不自然。AgentCube 提供了一组可直接落地的核心机制。

#kubernetes #人工智能 #容器 +3

在华为云 CCE 上解锁 AgentCube，打造高性能 AI Agent

随着大模型技术的飞速发展，AI Agent 正从概念走向生产。与传统的批处理任务或推理服务不同，Agent 工作负载呈现出独特的运行特征——间歇性活跃、极低延迟敏感、多轮会话状态持久化。然而，现有的 Kubernetes 调度体系主要面向批处理和长运行服务设计，难以有效应对这类"潮汐式"交互负载：空闲时资源白白占用，唤醒时又无法做到亚秒级响应，状态管理更是一大痛点。

#华为云 #人工智能 #云原生 +2

从生成到协同：AI编程如何重塑企业研发生态

#算法 #人工智能 #容器 +2

共 45 条

请选择