离线部署Qwen 和 DeepSeek

bloglin99999

192人浏览 · 2026-06-04 17:39:00

bloglin99999 · 2026-06-04 17:39:00 发布

deepseek的每个大模型参数都那么大，还是没有qwen3.6-35b等更平民化。我是不是可以理解deepseek使用了更多的显存以空间换时间

你的理解有一部分正确，但不完全准确。

更准确地说：

DeepSeek 不是简单地“用更多显存换时间”，而是采用了 MoE（Mixture of Experts，专家混合）架构，本质上是在 显存、参数规模、推理计算量之间做新的平衡。

为什么 DeepSeek 看起来参数特别大？

以 DeepSeek-V3 为例：

模型	总参数
Qwen3-32B	32B
Qwen3.6-35B-A3B	35B
DeepSeek-V3	671B
DeepSeek-R1	671B

看起来差了20倍。

但实际上：

DeepSeek-V3：

总参数 671B
每个Token实际激活约37B参数

也就是说：

671B（存储）
↓
37B（计算）

这正是 MoE 架构的特点。

Qwen3.6-35B-A3B 和 DeepSeek 的区别

Qwen3.6-35B-A3B

属于轻量MoE：

总参数：
35B

激活参数：
约3B

因此名字里的：

A3B

意思就是：

Active 3B

DeepSeek-V3

总参数：
671B

激活参数：
37B

每个Token需要计算37B参数。

对单张A100来说意味着什么？

Qwen3.6-35B-A3B

大致：

显存占用：
20~40GB

激活计算：
3B

优点：

快
吞吐高
便宜

DeepSeek-V3

即使4bit量化：

显存：
300GB+

完整模型权重必须放下。

虽然只激活37B参数：

计算量 ≈ 37B模型

但是：

存储量 ≈ 671B模型

所以：

MoE降低了计算量，但没有降低权重存储需求。

这是很多人第一次接触 DeepSeek 时容易误解的地方。

DeepSeek到底是在换什么？

实际上是：

更多显存
↓
换取更强能力
↓
而不是换更快速度

例如：

假设有两个模型：

Dense模型

72B参数
72B计算
72B存储

DeepSeek-V3

671B参数
37B计算
671B存储

结果：

能力：
671B级别

计算：
37B级别

显存：
671B级别

所以 DeepSeek 的核心思想是：

用超大的总参数容量提升知识和推理能力，但每次推理只激活一小部分专家，避免计算量爆炸。

为什么你觉得 Qwen 更“平民化”？

因为阿里在 Qwen3 系列上更重视：

部署友好性

例如：

模型	单卡A100
Qwen3-32B	√
Qwen3.6-35B-A3B	√
Qwen3-30B-A3B	√
DeepSeek-V3	×
DeepSeek-R1	×

Qwen 的很多模型设计目标就是：

单机
单卡
企业私有化

而 DeepSeek-V3/R1 的设计目标更接近：

数据中心
多机多卡
云服务

对你目前的硬件（A100 80GB）

如果目标是：

MCP Agent
RAGFlow
企业知识库
离线部署

那么从工程角度看：

模型	推荐度
Qwen3.6-35B-A3B	⭐⭐⭐⭐⭐
Qwen3-32B	⭐⭐⭐⭐⭐
GLM-4-32B	⭐⭐⭐⭐
DeepSeek-R1-Distill-Qwen-32B	⭐⭐⭐⭐
DeepSeek-V3	⭐
DeepSeek-R1 671B	⭐

原因很简单：

你的 A100 80GB 可以把 32B~35B 级别模型跑得非常舒服，但距离运行完整 DeepSeek-V3/R1 仍然差一个数量级。

所以对于私有化部署场景，很多企业最终发现：

Qwen3-32B、Qwen3.6-35B-A3B 这类模型的“能力/成本比”反而比 DeepSeek-V3 更高。

这也是为什么现在大量 RAGFlow、Dify、FastGPT、MCP Server 的生产环境，实际上优先选择 Qwen，而不是完整的 DeepSeek-V3。

亚马逊云科技技术品牌专区

更多推荐

算术胶子与自指宇宙：AGI本质的科学推论辨析——从椭圆曲线、Sha群、多世界诠释通往高阶文明的可能性（前沿理论框架猜想）

亚马逊云科技技术品牌专区

53.1.智能投喂器-硬件定时-基于STM32嵌入式物联网单片机软硬件毕业生系统设计【硬件+APP+云平台】

亚马逊云科技技术品牌专区

Docker容器安全加固指南

从2018年的Kubernetes漏洞到近年频发的容器逃逸事件，每一次安全事件都在提醒我们：容器安全不是可选项，而是必选项。真正的容器安全始于意识，固于技术，成于习惯。随着云原生技术的不断发展，安全威胁也在不断演变，唯有建立持续改进的安全文化，采用纵深防御策略，才能在这个动态变化的战场上保持主动。记住：最安全的容器不是无法攻破的容器，而是攻击者认为不值得花费精力攻击的容器。注：容器安全是一个快速发