logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通义千问 vs DeepSeek:国产大模型编程能力横评 2026

本文对国产大模型qwen和deepseek系列进行横向评测,采用统一测试框架对比编程场景表现。测试覆盖代码生成、Bug修复等核心场景,使用可复现的定量分析方法。结果显示:在代码生成方面,qwen-max和deepseek-v3表现相当,均能实现线程安全、关键字参数等完整功能;qwen-plus在边界条件处理稍弱;deepseek-r1因推理过程导致延迟较高但注释最详细。测试框架支持多模型统一调用,

#人工智能
GLM-5.1在Agent场景的性价比拆解:94%的Opus水准,价格只要1/3

GLM-5.1在Agent领域的优势与性价比分析 摘要:GLM-5.1作为智谱新一代旗舰模型,在Agent场景展现出独特优势。其核心特点是"宁可慢也不出错",在长链工具调用稳定性(连续50次无错)、长时间自主运行(8小时不偏离任务)和复杂指令遵循方面表现突出。公开数据显示,GLM-5.1在SWE-Bench Pro评测中以58.4%的准确率超越Claude Opus 4.6和G

#人工智能
Agent Harness架构拆解:为什么同一个模型在不同运行时里表现差3倍

本文从工程角度深入分析了Agent Harness的五层架构设计及其对模型表现的影响。通过类比CPU与整机的关系,说明Harness作为模型运行环境的重要性。五层架构包括:会话控制层(连接管理和触发机制)、上下文管理层(规范注入和窗口策略)、记忆层(跨会话知识持久化)、工具执行层(安全调用外部工具)和输出通道层(结果交付)。文章指出,Harness的设计质量直接影响模型20-40%的性能表现,并分

#架构
Agent Framework 1.0来了:一行代码切6个模型厂商

微软于4月3日发布了生产级开源框架Agent Framework 1.0,支持.NET和Python双语言,内置MCP和A2A协议,可一键切换6大模型厂商。相比LangChain的链式组合,MAF采用编排优先设计,内置Sequential、Group Chat和Magentic-One三种协作模式,特别适合多Agent协作、.NET集成及本地模型场景。其原生支持跨语言Agent通信和任务分解的Ma

#人工智能
开发者的新日常:下班前给 AI 留作业,早上起来收 PR

2026 年 4 月,海外开发者社区出现了一个新词叫"Sleep-Driven Development"——下班前把任务丢给 AI Agent,Agent 通宵干活,早上起来 Review PR。这不是玩笑,多个团队已经在生产环境中这么做了。这篇拆解背后的技术方案和坑。

#人工智能
开发者的新日常:下班前给 AI 留作业,早上起来收 PR

2026 年 4 月,海外开发者社区出现了一个新词叫"Sleep-Driven Development"——下班前把任务丢给 AI Agent,Agent 通宵干活,早上起来 Review PR。这不是玩笑,多个团队已经在生产环境中这么做了。这篇拆解背后的技术方案和坑。

#人工智能
MCP、A2A、AGENTS.md——Agent 标准之争,开发者到底该跟哪个

AI Agent 生态里目前有三个标准在抢地盘:Anthropic 的 MCP(9700 万次安装)、Google 的 A2A 协议、OpenAI+Google 联推的 AGENTS.md。很多人搞不清它们的关系——是竞争还是互补?我从官方文档和架构层面拆解一下,附选型建议。

#人工智能
GitHub上51%的代码已经是AI写的——海外开发者的工具栈长什么样

2026 年初,GitHub 披露了一个数据:**平台上超过 51% 的代码提交是由 AI 生成或深度辅助的。** Pragmatic Engineer 对 906 名海外工程师的调研也显示,多工具组合(不是只用一个)已经是主流。这篇梳理海外开发者实际在用的 AI 编程工具栈,以及背后的分工逻辑

#人工智能#github
GitHub上51%的代码已经是AI写的——海外开发者的工具栈长什么样

2026 年初,GitHub 披露了一个数据:**平台上超过 51% 的代码提交是由 AI 生成或深度辅助的。** Pragmatic Engineer 对 906 名海外工程师的调研也显示,多工具组合(不是只用一个)已经是主流。这篇梳理海外开发者实际在用的 AI 编程工具栈,以及背后的分工逻辑

#人工智能#github
Spectrum开源了:一套代码把AI Agent发到iMessage、WhatsApp、Telegram

Photon 前天开源了 Spectrum——一个 TypeScript SDK,让你的 AI Agent 同时跑在 iMessage、WhatsApp、Telegram、Discord、Slack 上。写一次 Agent 逻辑,`definePlatform` 选好渠道就能部署。我试了一天,踩了几个坑,也发现了一些意外的亮点。

#人工智能
    共 55 条
  • 1
  • 2
  • 3
  • 6
  • 请选择