weixin_50702559 个人主页

@weixin_50702559

weixin_50702559

2025-09-11 02:15:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

论编程能力，GLM和Claude还有多大的差距？

GLM虽然也支持2M token上下文，但在超长代码场景下，细节召回率、逻辑连贯性稍弱，处理多模块联动的重构任务时，更容易出现上下文遗漏、变量引用错误。代表测试集：SWE-bench Verified（真实GitHub仓库Bug修复，最贴近实际开发的基准）这是行业公认最有参考价值的编程能力测试，模型需要理解完整项目代码、定位问题、生成可通过全部测试的补丁，最能反映工程级编程能力。换算下来，GLM

#语言模型

论编程能力，GLM和Claude还有多大的差距？

#语言模型

到底了