logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

企业AI Agent生产环境架构:模型服务、任务编排、沙箱、AgentOps与算力规划

企业Agent不是单一模型服务。本文从生产架构角度拆解模型推理、Agent编排、数据与记忆、工具连接、安全运行时、AgentOps和基础设施七层能力,并分析容量规划、安全边界和分阶段部署方法。

文章图片
企业AI Agent生产环境架构:模型服务、任务编排、沙箱、AgentOps与算力规划

企业Agent不是单一模型服务。本文从生产架构角度拆解模型推理、Agent编排、数据与记忆、工具连接、安全运行时、AgentOps和基础设施七层能力,并分析容量规划、安全边界和分阶段部署方法。

文章图片
企业AI Agent生产环境架构:模型服务、任务编排、沙箱、AgentOps与算力规划

企业Agent不是单一模型服务。本文从生产架构角度拆解模型推理、Agent编排、数据与记忆、工具连接、安全运行时、AgentOps和基础设施七层能力,并分析容量规划、安全边界和分阶段部署方法。

文章图片
企业AI Agent生产环境架构:模型服务、任务编排、沙箱、AgentOps与算力规划

企业Agent不是单一模型服务。本文从生产架构角度拆解模型推理、Agent编排、数据与记忆、工具连接、安全运行时、AgentOps和基础设施七层能力,并分析容量规划、安全边界和分阶段部署方法。

文章图片
国产GPU能跑DeepSeek吗?天数智芯天垓150与智铠100怎么选?

摘要:随着企业AI私有化部署需求增长,国产GPU受到关注。天数智芯提供两条产品线:天垓150专注训练/微调/高性能推理,支持大模型;智铠100针对企业推理场景优化,适合知识库、Agent等应用。选型需结合业务需求,而非单纯比较算力参数。国产GPU在硬件性能上与NVIDIA差距缩小,但生态仍是挑战。企业部署需关注整体AI基础设施,包括网络、存储等配套方案。国产GPU在企业推理、行业AI等场景已具备竞

文章图片
#人工智能#语言模型#服务器
国产AI软件栈适配现状解析:DeepSeek、Qwen、vLLM、Dify在国产GPU上的部署实践

国产AI生态发展迅速,企业关注点已从硬件选型转向实际部署能力。当前主流国产开源模型(DeepSeek、Qwen等)和推理框架(vLLM、LMDeploy等)已完成初步适配,RAG知识库系统已具备成熟落地条件。文章剖析了企业AI系统的全栈层级,指出软件生态兼容性比硬件参数更关键,并揭示部署中最易踩的三个坑:忽视软件兼容性、未做性能验证、忽略运维体系。目前国产AI在知识库等场景已无障碍,但Agent等

文章图片
#人工智能#GPU#算力
AMD推出Radeon AI Pro R9700:32GB显存加持,发力AI推理与专业图形双场景

Radeon AI Pro R9700的发布,意味着AMD正式在AI工作站显卡领域亮出王牌。凭借RDNA 4的架构优势、32GB显存配置及面向推理优化的特性,R9700成为一款在图形性能与AI计算之间寻求平衡的新型专业显卡。

文章图片
#人工智能#服务器#科技 +2
万亿参数 MoE 私有化部署实战:Kimi K2.5 硬件选型与落地路径全解析

Kimi K2.5/K2.6万亿参数MoE模型企业部署指南 摘要: 本文详细介绍了Moonshot AI发布的Kimi K2.5/K2.6万亿参数稀疏大模型的私有化部署方案。两款模型采用相同的1万亿参数MoE架构(384路专家网络、320亿激活参数、256K上下文窗口),支持INT4量化部署。文章重点分析了硬件选型策略,推荐8×H200/H100服务器配置,并指出显存容量是部署关键因素。同时提供了

文章图片
#人工智能#语言模型#服务器 +1
企业开始批量部署Qwen3.6后,AI服务器应该怎么选?

企业部署国产大模型正从验证走向规模化应用。随着国产CPU/GPU成熟和开源模型(如Qwen3-VL、Gemma 4)降低门槛,企业可按业务需求选择不同规格模型和算力方案。本文提出四档典型部署方案:轻量级推理工作站(4B/9B模型)、部门级服务器(8B FP16推理)、企业级多模型并行(35B FP16)和训推一体旗舰方案(支持235B量化和微调)。选型应遵循"先定业务目标,再选模型规模"原则,重点

文章图片
#人工智能#服务器#运维
AMD官宣Zen 6/7 CPU与MI400/500 GPU路线图,全面进攻AI算力市场

纵观此次公布的路线图,AMD的雄心展露无遗:Zen 6与Zen 7架构将持续提升性能与能效,并深度集成AI能力;而Instinct MI400/MI500系列GPU则以年度迭代的节奏,在规格与性能上直接对标甚至意图超越NVIDIA,全面发力以争夺AI计算市场的领导地位。

文章图片
#人工智能#服务器#科技 +2
    共 108 条
  • 1
  • 2
  • 3
  • 11
  • 请选择