万亿参数！阿里 Qwen3-Max 正式发布，国产最强大模型来了？

木易AI信息差

470人浏览 · 2025-09-25 06:48:27

木易AI信息差 · 2025-09-25 06:48:27 发布

阿里，你是真猛。

就在昨天，一个平平无奇的周二，阿里一口气发布了 6 个新模型/Agent！

如此高产，令人惊叹。

网友直接震惊了：阿里发布新模型的速度，就像烤蛋糕一样简单！

在 6 个更新里，最靓的仔无疑要属 Qwen3-Max 正式版。

万亿参数是它身上最耀眼的标签，用阿里自己的话说，“大就是好，Just Scale it”。

今天就来聊聊 Qwen3-Max。

严格意义上来说，Qwen3-Max 并不是一个新模型。

早在两周前，阿里就发布了它的预览版 Qwen3-Max-Preview。

详情看这里：阿里通义 Qwen3-Max 深夜上新！

就是这个预览版，发布时间不长，却已经在 LMArena 大模型排行榜排到了第三名。甚至超过了 GPT-5-Chat。

今天发布的则是正式版的 Qwen3-Max。

除去基模，它面向用户的共有两个模型：非思考模型 Qwen3-Max-Instruct（已发布）及推理模型 Qwen3-Max-Thinking（还在训练中）。

从技术参数来看，Qwen3-Max 确实够“大”：

总参数超过 1T（1 万亿）
预训练使用了 36T tokens 的数据
采用 MoE（混合专家）架构，训练过程一气呵成

而从基准测试结果来看，Qwen3-Max 确实称得上 SOTA。

非思考模型 Qwen3-Max-Instruct 的性能大幅超越之前 Qwen 最厉害的 Qwen3-235B-A22B，甚至超过了 Claude Opus 4 Non-thinking，尤其是数学测评 AIME25 和编程测评 LiveCodeBench。

推理模型 Qwen3-Max-Thinking 更狠。AIME 25 和 HMMT25 直接双百满分，整体表现接近 GPT-5 Pro 和 Grok 4 Heavy。

Qwen3-Max 虽强，但需要注意的是，它是一个闭源模型。

你可以在 Qwen Chat 在线体验，完全免费。

Qwen Chat：https://chat.qwen.ai/

相较于国内的通义千问，更推荐 Qwen Chat。模型更全，功能更多，灵活性、可玩性更好。

如果你想调用 Qwen3-Max 的 API，那就只能在阿里云上付费使用了。

和 Qwen3-Coder 一样，Qwen3-Max 也是阶梯定价，注意小心“token 刺客”。

0-32K tokens：输入 1.2 美元/百万，输出 6 美元/百万
32K-128K tokens：输入 2.4 美元/百万，输出 12 美元/百万
128K-252K tokens：输入 3 美元/百万，输出 15 美元/百万

单从价格看，说实话，性价比一般般。

毕竟，OpenAI 的 GPT-5 API 价格也仅为输入 1.25 美元/百万 tokens，输出 10 美元/百万 tokens。而 GPT-5 的上下文长度可是有 40 万（400K）。

结语

理论上说，Qwen3-Max 可以算作国产 AI 模型目前的“天花板”了。

但实际体验还需要时间验证。

不管怎么讲，阿里这波操作，已经很值得一个大拇哥了。👍

我是木易，一个专注 AI 领域的技术产品经理，国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”，致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用 AI 为你的未来加速。

精选推荐

北京朝阳AI社区

更多推荐

上下文工程驱动智能体向元宇宙自主生态构建

北京朝阳AI社区

上下文工程驱动智能体向跨物种交互能力

北京朝阳AI社区

上下文工程驱动智能体向太空探索自适应决策

北京朝阳AI社区

所有评论(0)

查看更多评论

木易AI信息差

@weixin_40774379

已为社区贡献6条内容