logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent 的长时任务工程实践:超时、中断与断点续跑

--- 凌晨两点,告警响了。 用户提交了一个"分析竞品并生成完整报告"的 Agent 任务,任务包含:搜索 10 个竞品官网、提取关键信息、调用代码执行工具做数据对比、最后生成一份 3000 字的分析报告。

文章图片
#人工智能#AI
Multi-Agent框架选型实战:LangGraph vs CrewAI vs AutoGen,生产项目怎么选?

标签: AI Agent, LangGraph, CrewAI, AutoGen, Multi-Agent, 大模型, LLM, AI工程, 框架选型, 生产部署

文章图片
#microsoft#数据库#网络
用了 AI Coding 半年,代码量翻倍但维护变难:我们团队的「技术债决策矩阵」

--- 去年下半年,我们引入了 AI 辅助编码工具。前三个月,所有人都很兴奋——Story Points 完成速度快了,功能上线节奏也快了。但到第五个月,有个工程师跟我说了一句话,让我一直记到现在:

文章图片
#人工智能
AI Agent 跑24 小时后,我补上的 6 个运维护栏

Agent 上线第一周,我以为最大的挑战是"它能不能把任务做对"。 三个月之后,我意识到我错了。Agent 做对任务其实没那么难。真正难的是:它做错了一件事,我怎么最快知道?谁来接管?损失能不能回滚?

文章图片
#AI
多 Agent系统的编排工程实践:LangGraph vs AutoGen vs 自研调度器,我们踩的 5 个生产坑

去年我们把团队的智能客服系统从单 Agent 升级到多 Agent 协作架构,前后花了三个月,踩了无数坑,中途还把框架从 AutoGen 0.x 换成了 LangGraph,最后部分场景还是选择了自研调度器。这三个月里最痛的体验不是代码写不出来,而是每次以为搞定了,又冒出一个新的问题:成本超预算了、某个 Agent 在循环了、出了问题不知道是哪一步的锅。

文章图片
#AI
通义千问 vs DeepSeek:国产大模型编程能力横评 2026

本文对国产大模型qwen和deepseek系列进行横向评测,采用统一测试框架对比编程场景表现。测试覆盖代码生成、Bug修复等核心场景,使用可复现的定量分析方法。结果显示:在代码生成方面,qwen-max和deepseek-v3表现相当,均能实现线程安全、关键字参数等完整功能;qwen-plus在边界条件处理稍弱;deepseek-r1因推理过程导致延迟较高但注释最详细。测试框架支持多模型统一调用,

#人工智能
一文搞懂 AI 大模型 API 的 Token 计费机制

本文解析了大模型API的Token计费机制与实用省钱技巧。Token是文本处理的最小单位,中英文Token密度差异显著(中文约为英文2倍)。计费按输入/输出Token分开计算,输出通常更贵。文章对比了主流国产模型定价,指出DeepSeek-V3性价比突出,并分析了影响Token消耗的关键因素:System Prompt、Few-shot示例、对话历史和输出长度。通过智能客服案例展示了成本估算方法,

#人工智能#大数据
用 OpenAI SDK 直接调用 Claude/Gemini/DeepSeek — 零改动迁移指南

摘要: TheRouter 提供了一种无缝迁移方案,让开发者无需修改现有 OpenAI SDK 代码即可调用 Claude、Gemini、DeepSeek 等模型。只需替换 api_key、base_url 和 model 参数,其他代码(包括流式输出、Embeddings、LangChain/LlamaIndex 集成)完全兼容。支持标准化模型标识(如 anthropic/claude-sonn

#人工智能
Python/Node.js/Go 三语言接入 AI API 网关的最佳实践

本文介绍了如何通过TheRouter API网关统一调用Claude、GPT、Gemini、DeepSeek等主流AI模型,解决了多模型SDK差异、API Key分散管理等问题。文章提供了Python、Node.js两种语言的完整接入方案,包括基本对话、流式输出和错误处理的具体代码实现。通过TheRouter网关,开发者只需修改base_url即可兼容OpenAI API格式,实现多模型的无缝切换

#python#node.js#golang
DeepSeek-R1 vs Claude Sonnet:推理任务谁更强?附真实 benchmark

摘要:本文对比了DeepSeek-R1和Claude Sonnet 4在数学推理、逻辑推理、多步骤复合任务和代码推理上的表现。DeepSeek-R1在数学和逻辑推理中展现出更强的透明度和自我纠错能力,而Claude Sonnet 4在多步骤推理和代码调试中表现更稳定且用户友好。价格上DeepSeek-R1更经济,但Claude响应速度更快。选择取决于具体场景:DeepSeek-R1适合需要详细推理

#人工智能
    共 169 条
  • 1
  • 2
  • 3
  • 17
  • 请选择