自律懒人个人主页

@weixin_50937681

自律懒人

2023-01-02 21:59:18 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-5.2、DeepSeek V4 Pro、MiniMax M3、Kimi K2.7——4大国产开源模型编程能力横评：开源智能指数前6全是国产，差距到底有多大？

2026年7月开源大模型格局剧变：AA Index前6全是中国模型。本文实测GLM-5.2、DeepSeek V4 Pro、MiniMax M3、Kimi K2.7 Code四款国产旗舰，含SWE-bench数据、5个真实开发任务横评、Agent能力对比和成本分析。

#开源

GPT-5.6 Sol/Terra/Luna vs Claude Fable 5 全方位横评：编程能力只差3%，成本差3倍——4大维度实测告诉你该不该换

GPT-5.6全面开放后Sol/Terra/Luna三档模型与Claude Fable 5的4大维度横向实测对比，包含编程能力、成本效率、Max/Ultra模式深度评测和按场景选型建议。

GPT-5.6 Sol/Terra/Luna vs Claude Fable 5 全方位横评：编程能力只差3%，成本差3倍——4大维度实测告诉你该不该换

GPT-5.6全面开放后Sol/Terra/Luna三档模型与Claude Fable 5的4大维度横向实测对比，包含编程能力、成本效率、Max/Ultra模式深度评测和按场景选型建议。

GPT-5.6 Sol/Terra/Luna vs Claude Fable 5 全方位横评：编程能力只差3%，成本差3倍——4大维度实测告诉你该不该换

GPT-5.6全面开放后Sol/Terra/Luna三档模型与Claude Fable 5的4大维度横向实测对比，包含编程能力、成本效率、Max/Ultra模式深度评测和按场景选型建议。

三强争霸：GPT-5.6 Sol vs Claude Fable 5 vs 豆包Seed-2.1 Pro——最新Agent模型实测横评

GPT-5.6 Sol、Claude Fable 5、Claude Sonnet 5、豆包Seed-2.1 Pro——六月底三大厂商同时发新，TerminalBench最高91.9%，最低只要1/12价格。一张表看清五款模型的编程能力、定价、可用性，附场景化选型建议。

#前端 #人工智能

MCP vs A2A：两大 AI Agent 通信协议深度对比实测，我的结论可能和你想的不一样

两个 Agent 之间怎么通信，你选哪条路？前段时间我在折腾 MCP 协议做工具集成，效果确实不错。但还没高兴两天，Google 的 A2A 协议就杀出来了——而且来势汹汹，社区里两边支持者吵得不可开交。有人说 MCP 代表了未来，有人说 A2A 才是正道。我干脆花了两天时间，把两个协议都撸了一遍，从原理到代码到实际跑通，做个彻底的对比。不吹不黑，结论可能跟你想象的不一样。# 为什么突

#网络

Claude Code + MCP 实战：搞了个自动部署工具，我的发版流程从 20 分钟变成 2 分钟

搞了两天，我把项目的部署流程彻底重构了。用 Claude Code + 自定义 MCP Server 搭了一套自动化发版工具。以前手动部署一次至少 20 分钟——连服务器、拉代码、切分支、跑构建、重启服务、看日志确认启动成功。现在跟 Claude 说一句话，两分钟搞定。这篇文章就记录一下我是怎么做的，踩了哪些坑，以及一些真实感受。# 为啥要折腾这个先交代一下背景。我们项目用的

#深度学习 #python #vscode

阿里Qoder 1.0实测：对比Cursor和Claude Code，国产AI编程工具做到哪一步了？

---title: 阿里Qoder 1.0实测：对比Cursor和Claude Code，国产AI编程工具做到哪一步了？slot: csdn-maindate: 2026-05-21direction: 对比实测words: 3200---刚刷到阿里发布 Qoder 1.0 的消息，号称"可全面接管代码生成、验证和交付流程"。好家伙，这话听着有点大。Cursor 和 Claude

#jvm #深度学习

2026年AI编程工具横评：Trae、Cursor、Claude Code、Copilot X，同一需求谁更强？

# 为什么突然要横评编程工具？事情要从上周说起。有个需求要写一个「从 GitHub Release 自动提取更新日志并推送企业微信」的小工具。按以往习惯，打开 Cursor 开干。但刷到 DeepSeek 正在组建 Harness 团队做编程 Agent、Cursor 刚发 Composer 2.5、Trae 的 SOLO 版号称「一人成军」——我意识到，2026 年 5 月的编程工具市场，

#copilot #java

19款模型×4大维度深度横评：2026年6月大模型Coding能力谁称王？

2026年6月Artificial Analysis发布530款模型最新基准测试。GPT-5.5以59.1分制霸Coding指数，Claude Opus 4.8以77.8分加冕Agentic新王。国产模型全面跻身全球前十——Qwen3.7 Max第7、DeepSeek V4 Pro第8、MiniMax-M3 Agentic全球第5。本文从4大维度19款模型深度横评，附选型建议。

#人工智能

共 60 条

请选择