云-缩影个人主页

@weixin_70361709

云-缩影

2022-12-30 20:52:56 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

不用GPU、不用写Dockerfile，我是怎么1小时搭出可上线的AI Agent的

最近大模型应用开发圈子里，Agent 绝对是最热的关键词之一。从自动化办公到智能客服，从代码辅助到数据分析，AI Agent 正在把"大模型能聊天"变成"大模型能干活"。本地能跑通的 Demo，一上生产就各种环境问题模型调用、权限管理、日志监控……基础设施搭了一半，业务逻辑还没开始写团队里有人会写 Python，有人熟悉 Node.js，技术栈统一成本高。

#人工智能

不用GPU、不用写Dockerfile，我是怎么1小时搭出可上线的AI Agent的

#人工智能

不用GPU、不用写Dockerfile，我是怎么1小时搭出可上线的AI Agent的

#人工智能

不想维护服务器却要跑生产级 AI Agent？我用函数计算 AgentRun 搭了一套

去年底接了一个需求：给公司内部运营团队搭一个智能助手，要能查数据、调 API、还要能多轮对话。一开始我的方案是自己起一台 ECS，跑 FastAPI + LangChain，把 Agent 的状态存 Redis，感觉挺稳。但维护起来是真的烦。模型调用偶尔超时、服务扩容要手动改配置、偶发的 OOM 问题每次都要 SSH 上去查日志——这些和业务逻辑无关的事情占了我大量时间。后来换到了阿里云的 Age

#服务器 #人工智能 #运维

Python 实战：基于阿里云百炼 Qwen3.7 的 AI Agent 开发指南（Function Calling 详解）

本文分享了基于阿里云百炼和Qwen3.7-Max模型构建AI Agent的实践经验。作者对比了OpenAI、开源模型和百炼方案的优劣，最终选择百炼主要出于数据合规和工具调用能力的考量。文章详细介绍了环境配置、工具定义、Agent循环实现及多轮调用的处理方法，并总结了工具描述精准性、ID匹配和性能优化等踩坑点。实际测试表明，Qwen3.7在并行工具调用和长上下文处理上表现优异，成本较GPT-4低60

#python #阿里云 #人工智能

Serverless AI Agent 实战：用阿里云 AgentRun + Google ADK 搭建多智能体协同工作流

本文介绍如何基于阿里云函数计算和Google ADK框架构建多Agent协同系统。该系统通过搜索Agent、分析Agent和报告Agent的协作，实现自动化竞品分析流水线。各Agent运行在独立函数计算实例上，通过NAS共享存储传递中间数据，具备弹性伸缩能力。文章详细展示了搜索Agent的代码实现，并说明了系统部署方式和实践注意事项，包括框架选择、数据传递方案和成本控制等。这种架构有效解决了单Ag

#java #网络 #linux

不想维护服务器却要跑生产级 AI Agent？我用函数计算 AgentRun 搭了一套

#服务器 #人工智能 #运维

不想维护服务器却要跑生产级 AI Agent？我用函数计算 AgentRun 搭了一套

#服务器 #人工智能 #运维

生产环境 Agent 总“抽风“？这套“人工 SOP + 大模型“混合架构让我省了 80% 的调试时间

摘要：在生产环境中部署LLM Agent时，开放域的自主规划与垂直域的确定性要求存在矛盾，导致API调用错误、循环等问题。解决方案是采用“三明治”架构，将Agent分为感知层（意图识别）、决策层（规则引擎+LLM兜底）和执行层（工具调用），高频路径走人工SOP，异常分支才由大模型决策。实战中，使用Qwen3.6进行意图识别，结合人工SOP确保稳定性。建议Prompt中要求输出置信度、限制工具调用

#架构

我在阿里云 PAI 上私有化部署了 Qwen3-Coder，推理成本比公有 API 降低了 60%

团队对代码安全有合规要求，没法直接用云端编码助手。本文记录了我基于阿里云 PAI + vLLM 私有化部署 Qwen3-Coder 的全过程，包括模型选型、推理优化、显存压缩技巧和成本对比，适合有私有部署需求的技术团队参考。

#阿里云 #云计算

共 34 条

请选择