阿里,你是真猛。

就在昨天,一个平平无奇的周二,阿里一口气发布了 6 个新模型/Agent!

如此高产,令人惊叹。

网友直接震惊了:阿里发布新模型的速度,就像烤蛋糕一样简单!

在 6 个更新里,最靓的仔无疑要属 Qwen3-Max 正式版。

万亿参数是它身上最耀眼的标签,用阿里自己的话说,“大就是好,Just Scale it”。

今天就来聊聊 Qwen3-Max


严格意义上来说,Qwen3-Max 并不是一个新模型。

早在两周前,阿里就发布了它的预览版 Qwen3-Max-Preview

详情看这里:阿里通义 Qwen3-Max 深夜上新!

就是这个预览版,发布时间不长,却已经在 LMArena 大模型排行榜排到了第三名。甚至超过了 GPT-5-Chat

今天发布的则是正式版的 Qwen3-Max

除去基模,它面向用户的共有两个模型:非思考模型 Qwen3-Max-Instruct(已发布)及推理模型 Qwen3-Max-Thinking(还在训练中)。

从技术参数来看,Qwen3-Max 确实够“大”:

  • 总参数超过 1T(1 万亿)

  • 预训练使用了 36T tokens 的数据

  • 采用 MoE(混合专家)架构,训练过程一气呵成

而从基准测试结果来看,Qwen3-Max 确实称得上 SOTA。

非思考模型 Qwen3-Max-Instruct 的性能大幅超越之前 Qwen 最厉害的 Qwen3-235B-A22B,甚至超过了 Claude Opus 4 Non-thinking,尤其是数学测评 AIME25 和编程测评 LiveCodeBench。

推理模型 Qwen3-Max-Thinking 更狠。AIME 25 和 HMMT25 直接双百满分,整体表现接近 GPT-5 ProGrok 4 Heavy


Qwen3-Max 虽强,但需要注意的是,它是一个闭源模型。

你可以在 Qwen Chat 在线体验,完全免费。

Qwen Chat:https://chat.qwen.ai/

相较于国内的通义千问,更推荐 Qwen Chat。模型更全,功能更多,灵活性、可玩性更好。

如果你想调用 Qwen3-Max 的 API,那就只能在阿里云上付费使用了。

和 Qwen3-Coder 一样,Qwen3-Max 也是阶梯定价,注意小心“token 刺客”。

  • 0-32K tokens:输入 1.2 美元/百万,输出 6 美元/百万

  • 32K-128K tokens:输入 2.4 美元/百万,输出 12 美元/百万

  • 128K-252K tokens:输入 3 美元/百万,输出 15 美元/百万

单从价格看,说实话,性价比一般般。

毕竟,OpenAI 的 GPT-5 API 价格也仅为输入 1.25 美元/百万 tokens,输出 10 美元/百万 tokens。而 GPT-5 的上下文长度可是有 40 万(400K)。


结语

理论上说,Qwen3-Max 可以算作国产 AI 模型目前的“天花板”了。

但实际体验还需要时间验证。

不管怎么讲,阿里这波操作,已经很值得一个大拇哥了。👍


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

Logo

更多推荐