logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

JavaPython技术架构大模型AIGC

可提供的服务

技术咨询

构建稳定、高效、弹性且易于维护的大模型多副本生产环境

大模型多副本部署技术要求涵盖基础设施、编排管理、流量调度和监控运维等关键环节。基础设施需满足GPU独占、高速网络和共享存储等要求;部署编排依赖Kubernetes实现容器化管理和自动扩缩;流量管理通过负载均衡、健康检查等机制保障服务稳定性;监控体系需覆盖指标、日志和链路追踪。采用容器化、服务网格等技术方案,可实现高可用、高并发的大模型推理服务。

文章图片
构建稳定、高效、弹性且易于维护的大模型多副本生产环境

大模型多副本部署技术要求涵盖基础设施、编排管理、流量调度和监控运维等关键环节。基础设施需满足GPU独占、高速网络和共享存储等要求;部署编排依赖Kubernetes实现容器化管理和自动扩缩;流量管理通过负载均衡、健康检查等机制保障服务稳定性;监控体系需覆盖指标、日志和链路追踪。采用容器化、服务网格等技术方案,可实现高可用、高并发的大模型推理服务。

文章图片
用嘴画图:AI 一句话搞定架构图流程图(THS)

简介:还在为画图头疼吗?* 产品画流程图,排版半天;* 售前看到竞对一张好图,想拿过来,要一笔笔画;* 开发想要架构图,还得手动画。这次分享带你体验:一句话让 AI 自动出图,流程图、架构图、时序图都能搞定。
从此,画图不再是负担,而是乐趣。

文章图片
#人工智能#流程图
稠密模型 和稀疏模型一文解答

稠密模型与稀疏模型的核心区别在于参数激活方式:稠密模型每次计算激活全部参数(如BERT、GPT-3),适合资源受限场景;稀疏模型(如MoE架构的Mixtral 8x7B)则按需激活部分参数,能高效扩展至万亿规模,但需更高显存。稠密模型优势是低延迟和易部署(≤70B参数),而稀疏模型适合追求极致性能的超大模型(≥100B参数),以更低计算成本获得更强能力。技术选型需权衡硬件资源、延迟需求与模型性能目

文章图片
稠密模型 和稀疏模型一文解答

稠密模型与稀疏模型的核心区别在于参数激活方式:稠密模型每次计算激活全部参数(如BERT、GPT-3),适合资源受限场景;稀疏模型(如MoE架构的Mixtral 8x7B)则按需激活部分参数,能高效扩展至万亿规模,但需更高显存。稠密模型优势是低延迟和易部署(≤70B参数),而稀疏模型适合追求极致性能的超大模型(≥100B参数),以更低计算成本获得更强能力。技术选型需权衡硬件资源、延迟需求与模型性能目

文章图片
国产AI训推一体机

本文汇总了市面上几款支持DeepSeek等主流大模型的训推一体机产品,包括宝德-OpenEuler、华为FusionCube A3000、天翼云息壤和飞腾AI等型号。通过对比表格详细展示了各产品在核心硬件、算力表现、支持模型、软件框架等方面的关键参数,并分析了各自的主要优势和适用场景。文章还提供了选购建议,从性能成本、自主可控、部署便捷性、功能扩展性等维度给出指导,最后提醒用户注意明确需求、进行测

文章图片
#人工智能#华为
国产AI训推一体机

本文汇总了市面上几款支持DeepSeek等主流大模型的训推一体机产品,包括宝德-OpenEuler、华为FusionCube A3000、天翼云息壤和飞腾AI等型号。通过对比表格详细展示了各产品在核心硬件、算力表现、支持模型、软件框架等方面的关键参数,并分析了各自的主要优势和适用场景。文章还提供了选购建议,从性能成本、自主可控、部署便捷性、功能扩展性等维度给出指导,最后提醒用户注意明确需求、进行测

文章图片
#人工智能#华为
英伟达(NVIDIA)的GPU架构

英伟达GPU架构经历了从通用计算到专用AI计算的演进。早期Tesla、Fermi奠定并行计算基础;Kepler、Maxwell提升能效;Pascal开始支持深度学习。Volta首次引入Tensor Core,Turing加入RT Core,实现AI训练和光追突破。Ampere和Hopper专注AI计算,支持大规模Transformer训练。最新Blackwell采用双芯片设计,面向万亿参数模型。未

文章图片
#架构#GPU
主流 vGPU 技术方案

vGPU 技术方案各有千秋,你的选择很大程度上取决于应用场景:追求稳定、安全且预算充足的虚拟化环境,可考虑 NVIDIA vGPU 或 AMD MxGPU。主要在 Kubernetes 中部署 AI 应用,希望提升 GPU 利用率并实现细粒度共享,开源方案 HAMi 是一个值得尝试的选择。对于临时、简单的测试环境,NVIDIA MPS 可以快速上手,但要小心其稳定性问题。希望这些信息能帮助你做出更

文章图片
docker 挂载宿主机根目录(高风险警告)

⚠️ 挂载宿主机根目录到Docker容器的高风险警示 通过-v /:/host_root或--mount可挂载根目录,但此操作会暴露宿主机所有文件,存在严重安全风险(数据泄露、系统崩溃等)。 🔒 安全建议 1️⃣ 优先挂载特定子目录(如-v /path:/container_path) 2️⃣ 添加:ro设为只读模式降低风险 3️⃣ 避免使用--privileged特权模式 💡 仅限必要场景(

文章图片
#docker#java#dubbo
    共 104 条
  • 1
  • 2
  • 3
  • 11
  • 请选择