万亿参数!阿里 Qwen3-Max 正式发布,国产最强大模型来了?
万亿参数!阿里 Qwen3-Max 正式发布,国产最强大模型来了?
阿里,你是真猛。
就在昨天,一个平平无奇的周二,阿里一口气发布了 6 个新模型/Agent!
如此高产,令人惊叹。
网友直接震惊了:阿里发布新模型的速度,就像烤蛋糕一样简单!
在 6 个更新里,最靓的仔无疑要属 Qwen3-Max
正式版。
万亿参数是它身上最耀眼的标签,用阿里自己的话说,“大就是好,Just Scale it”。
今天就来聊聊 Qwen3-Max
。
严格意义上来说,Qwen3-Max
并不是一个新模型。
早在两周前,阿里就发布了它的预览版 Qwen3-Max-Preview
。
详情看这里:阿里通义 Qwen3-Max 深夜上新!
就是这个预览版,发布时间不长,却已经在 LMArena 大模型排行榜排到了第三名。甚至超过了 GPT-5-Chat
。
今天发布的则是正式版的 Qwen3-Max
。
除去基模,它面向用户的共有两个模型:非思考模型 Qwen3-Max-Instruct
(已发布)及推理模型 Qwen3-Max-Thinking
(还在训练中)。
从技术参数来看,Qwen3-Max
确实够“大”:
-
总参数超过 1T(1 万亿)
-
预训练使用了 36T tokens 的数据
-
采用 MoE(混合专家)架构,训练过程一气呵成
而从基准测试结果来看,Qwen3-Max
确实称得上 SOTA。
非思考模型 Qwen3-Max-Instruct
的性能大幅超越之前 Qwen 最厉害的 Qwen3-235B-A22B
,甚至超过了 Claude Opus 4 Non-thinking
,尤其是数学测评 AIME25 和编程测评 LiveCodeBench。
推理模型 Qwen3-Max-Thinking
更狠。AIME 25 和 HMMT25 直接双百满分,整体表现接近 GPT-5 Pro
和 Grok 4 Heavy
。
Qwen3-Max
虽强,但需要注意的是,它是一个闭源模型。
你可以在 Qwen Chat 在线体验,完全免费。
Qwen Chat:https://chat.qwen.ai/
相较于国内的通义千问,更推荐 Qwen Chat。模型更全,功能更多,灵活性、可玩性更好。
如果你想调用 Qwen3-Max
的 API,那就只能在阿里云上付费使用了。
和 Qwen3-Coder
一样,Qwen3-Max
也是阶梯定价,注意小心“token 刺客”。
-
0-32K tokens:输入 1.2 美元/百万,输出 6 美元/百万
-
32K-128K tokens:输入 2.4 美元/百万,输出 12 美元/百万
-
128K-252K tokens:输入 3 美元/百万,输出 15 美元/百万
单从价格看,说实话,性价比一般般。
毕竟,OpenAI 的 GPT-5
API 价格也仅为输入 1.25 美元/百万 tokens,输出 10 美元/百万 tokens。而 GPT-5
的上下文长度可是有 40 万(400K)。
结语
理论上说,Qwen3-Max
可以算作国产 AI 模型目前的“天花板”了。
但实际体验还需要时间验证。
不管怎么讲,阿里这波操作,已经很值得一个大拇哥了。👍
我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。
相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用 AI 为你的未来加速。
精选推荐
更多推荐
所有评论(0)