
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战
本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战
本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

到底了







