logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战

本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

文章图片
#DeepSeek
在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战

本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

文章图片
#DeepSeek
到底了