logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

HAMi v2.8重磅发布详解:标准化与生态多样性的双重演进

title: “HAMi v2.8 重磅发布详解:标准化与生态完整性的双重演进”coverTitle: “HAMi v2.8 重磅发布详解:标准化与生态完整性的双重演进”excerpt: “HAMi v2.8 深度解析:新增 Kubernetes DRA 支持、Leader 选举机制、CDI 模式支持,异构 GPU 生态扩展(天数智芯、沐曦 GPU、华为昇腾),上下游生态集成(Kueue、vLLM

#云原生#开源
HAMi v2.8重磅发布详解:标准化与生态多样性的双重演进

title: “HAMi v2.8 重磅发布详解:标准化与生态完整性的双重演进”coverTitle: “HAMi v2.8 重磅发布详解:标准化与生态完整性的双重演进”excerpt: “HAMi v2.8 深度解析:新增 Kubernetes DRA 支持、Leader 选举机制、CDI 模式支持,异构 GPU 生态扩展(天数智芯、沐曦 GPU、华为昇腾),上下游生态集成(Kueue、vLLM

#云原生#开源
《走向统一的异构算力抽象:星环科技在寒武纪、海光适配与 DRA 建模的实践》— 侯雨希

星环科技在寒武纪、海光等国产加速器上的适配实践,展示了 HAMi 作为统一算力抽象与调度底座的价值,也验证了 DRA 在异构资源建模中的未来潜力。通过双方的深度协同,国产 GPU 能力得以在云原生体系内被一致管理,而 LLMOps 平台也获得了跨架构、跨型号的统一资源视图。

#云原生#人工智能#科技
Xinference × HAMi | 共建异构算力新基座,让 AI 推理更普惠、更高效

已合并到官方 Helm Charts,开启 vGPU 只需在 values 里打开开关(Supervisor/Worker 可分别启用)。把 Xinference 的“多模型易用 + OpenAI-兼容”与 HAMi 的“细粒度 vGPU 配额 + 统一治理”结合起来,就能在。这类场景非常适合:Embedding/Rerank/小语音/轻量 Agent 工具模型,并发量大但单模型占用小。模型推理进

文章图片
#人工智能
《打造高效算力池:HAMi 探索异构算力调度的最佳实践》— 李孟轩

随着大模型训练与推理规模不断扩大,企业对 GPU、XPU 等异构算力的调度需求变得更复杂、更多样。作为目前业内专注于异构 GPU 资源共享和调度的开源项目,HAMi 在 2.7.0 版本中完成了多项关键升级,并在 2.8.0 版本 Roadmap 中进一步规划了调度性能和 DRA 方向的演进,使 GPU 资源管理从“可用”迈向“更易用、更统一、更高性能”。在本次演讲中,HAMi 核心 mainta

#科技
面向算力虚拟化的开源探索:如何看待 Flex:ai,以及为什么工程交付如此重要

开源的价值在于协作与共同演进。不同团队处于不同阶段、选择不同路径很正常;真正重要的是,行业讨论始终围绕可验证交付与工程事实推进:能力边界清晰、证据链可复现、运维闭环可依赖。密瓜智能与 HAMi 社区将持续专注于把算力虚拟化从“可切分”推进到“可治理”,并在开放协作中推动形成可互操作、可持续演进的事实标准。讨论欢迎公开进行;工程欢迎一起把复杂问题真正解决;标准也欢迎在实践与证据之上共同推进。

#开源#人工智能
HAMi Meetup-贝壳找房 回顾:vGPU 推理集群的实践经验

在大规模 AI 推理场景中,“算力不够”往往并非由硬件规模不足导致。贝壳找房(以下简称贝壳)在千卡级 GPU 集群规模下,整体 GPU 利用率约为 13%,主要问题来自小模型与多模型混跑场景下的显存碎片化以及整卡独占使用方式。在集群中存在 141G 等大显存 GPU 时,使用整卡运行 32B 以下模型,甚至仅占用 1–2G 显存的小模型服务,会导致大量显存长期处于空闲状态。

#性能优化#开源#云原生
DaoCloud:用 HAMi 构建更灵活的 GPU 云平台

在 AI 训练与推理需求持续增长的背景下,如何提升 GPU 利用率、降低算力成本,并同时兼顾多样化业务场景,成为云平台面临的核心挑战。「DaoCloud 道客」围绕这一问题,在其公有与私有 GPU 云平台中使用 CNCF Sandbox 开源项目 HAMi,构建了一套更加灵活、云原生的 GPU 资源管理方式。本文基于 DaoCloud 在真实生产环境中的实践经验,梳理其在 GPU 云平台建设过程中

#开源#云原生
密瓜重磅|CNCF 大使,中国云原生与开源领域代表实践者 宋净超(Jimmy Song)加入密瓜智能

近日,云原生与开源领域资深技术人正式加入密瓜智能,出任。随着 Jimmy 加入,将助力密瓜智能在 AI 原生基础设施生态建设、全球开发者协作领域的布局,为相关实践提供经验参考。作为,Jimmy 是中国云原生领域公认的技术实践者与传播者之一。在 Kubernetes、Service Mesh 、分布式系统等关键技术尚未成为行业共识之前,他已深度参与相关实践与传播,是国内较早系统性引介云原生架构的技术

#云原生#开源
!不卷算力卷效率|HAMi Meetup 上海站技术笔记全回顾!

本次 HAMi Meetup 聚焦提升算力效率,不仅沉淀了多份企业级实战干货与行业协同共识,更让现场与线上的开发者们实现了深度思维碰撞 —— 从技术细节探讨到业务场景适配,从开源生态共建到国产算力创新,交流热度持续升温。未来,HAMi 社区将继续以开源力量为纽带,联动更多行业伙伴与开发者,深耕异构算力调度领域,让轻量化、高适配的算力提效方案惠及更多企业,共同推动数字经济高质量发展!期待下次 Mee

文章图片
    共 24 条
  • 1
  • 2
  • 3
  • 请选择