大土咪个人主页

@weixin_39497034

大土咪

2026-07-01 03:52:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战

本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

文章图片

在双 H100 上用 vLLM 部署 DeepSeek‑V4‑Flash(1M 上下文)+ 编程 Agent 实战

本文记录在一台双 NVIDIA H100 NVL(合计约 192GB 显存)服务器上,用 vLLM 0.23 部署DeepSeek-V4-Flash(原生 1M 上下文、FP8 量化)的完整实战,并接入 codex、qwen-code、opencode三个命令行编程 Agent。

文章图片

到底了