GLM-4.6 - 智谱新一代旗舰大模型

GLM-4.6是智谱推出的新一代355B参数量旗舰大模型，在代码能力、推理性能、多语言处理等方面实现全面突破。该模型支持200K超长上下文，编程能力比肩Claude Sonnet 4，在7大权威评测中表现优异。GLM-4.6适配寒武纪芯片和摩尔线程GPU，提供FP8+Int4混合量化部署方案，显著降低推理成本。现已上线智谱MaaS平台，提供Coding Max和企业版等订阅服务，适用于编程开发、文

qq_33002279

639人浏览 · 2025-09-30 16:29:51

qq_33002279 · 2025-09-30 16:29:51 发布

GLM-4.6 - 智谱新一代旗舰大模型

概述

GLM-4.6 是智谱推出的新一代基座大模型，总参数量达 355B，激活参数 32B。模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力及智能体应用等方面实现全面进阶。

核心特性：

🚀 代码能力比肩 Claude Sonnet 4
📖 上下文长度提升至 200K
🔍 推理和搜索能力显著增强
🌍 多语言翻译效果更佳
💰 性价比优势突出

适配能力： 适配寒武纪芯片，能实现高效推理部署。

可用性： 现已上线智谱 MaaS 平台。

主要功能

功能领域	能力描述
编程能力	公开基准与真实编程任务中表现卓越，复杂调试、跨工具调用等场景突出
上下文处理	上下文窗口由128K提升至200K，支持超长文档阅读与跨文件编程
推理能力	支持工具增强推理，在多个评测基准上取得开源模型最佳表现
信息搜索	优化长时程、深度信息探索任务，擅长深度研究及信息整合
写作能力	文风、可读性与角色扮演场景更符合人类偏好
多语言翻译	跨语种任务处理效果增强，翻译精准流畅
智能体应用	原生支持多类智能体任务，覆盖办公、开发、写作与内容创作

性能表现

综合评测

在7大权威基准测试中表现卓越：

✅ AIME 25
✅ LCB v6
✅ HLE
✅ SWE-Bench Verified
✅ BrowseComp
✅ Terminal-Bench
✅ τ²-Bench

测试结果： 与国际顶尖模型 Claude Sonnet 4 比肩，稳居国产模型首位。

真实编程评测

性能优势：

🥇 超越其他国产模型
🥈 领先 Claude Sonnet 4
💡 平均 tokens 消耗更低
⚡ 比 GLM-4.5 节省 30%+ tokens

硬件适配

寒武纪芯片适配

🔧 FP8+Int4 混合量化部署
🎯 首款国产芯片 FP8+Int4 一体化解决方案
💵 大幅降低推理成本

摩尔线程 GPU 适配

⚙️ 基于 vLLM 推理框架部署
💻 原生 FP8 精度稳定运行
🌐 MUSA 架构生态兼容优势

使用方式

通过智谱 MaaS 平台

访问 bigmodel.cn
注册并创建账号
选择 GLM-4.6 模型
输入问题获取结果

API 接口调用

获取API密钥：在智谱 MaaS平台注册账号后，获取API密钥。
调用API：根据平台提供的API文档，使用HTTP请求调用GLM-4.6的API接口，将问题或任务作为参数传递。
解析结果：接收API返回的JSON格式结果，并解析其中的内容。

通过z.ai平台：

海外用户可以通过z.ai平台使用GLM-4.6。

订阅服务

套餐类型

套餐类型	适用用户	核心优势
GLM Coding Max	高频重度开发者	三倍用量，高强度开发
GLM Coding Plan 企业版	企业用户	安全、成本效益、国际顶尖性能

服务优化

🖼️ 新增图像识别与搜索能力
🛠️ 支持10+主流编程工具
📊 优化套餐内容和用量
💎 提升性价比

应用场景

场景	应用价值
编程开发	高效生成高质量代码，提升开发效率
文档处理	处理超长文档，支持跨文件编程
智能推理	快速准确解决复杂问题
信息搜索	快速获取关键信息，提升工作效率
写作创作	生成高质量、风格多样的文本

更新时间：2024年12月
数据来源：智谱AI官方发布

北京朝阳AI社区

更多推荐

什么是模型上下文协议（MCP）？

在深入MCP之前，我们需要先了解一个背景概念——工具调用。简单而言，工具调用指的是AI模型主动调用外部工具或API，以自动执行特定任务的过程。例如，你向一个智能助手提出：“帮我预订10月15日从纽约飞往旧金山的航班。模型识别：AI模型首先确定该任务需要调用外部的航班预订工具。工具调用：AI通过调用相关的API（例如航空公司接口）提供所需的信息。数据交互：AI获取航班信息，例如当天有9点和下午3点两