
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2025-2026年AI发展呈现三大趋势:技术层面,AI将从聊天模型转向具备任务执行能力的智能体系统,融合世界模型和NSP范式;算力发展更注重效率与绿色化,推理算力占比超60%,边缘计算和低能耗模型受重视;应用落地聚焦可量化价值,企业级AI将经历"幻灭低谷"后迎来V型反转,制造业、医疗等领域深度融合。同时,数据治理转向高质量与合成数据应用,安全伦理问题需前置设计。人机协作将重构
本文介绍了一种通过"配置+约定"方式构建多技能AI助理的方法。该系统包含三个核心功能:生成待办清单、撰写日报和制定30天学习计划。实现方式采用极简设计:每个技能对应一个Markdown文件描述使用场景和输出格式,通过JSON配置文件管理技能ID和触发关键词。主程序自动匹配用户输入中的关键词,调用相应技能模板与GPT模型交互。这种架构优势在于:1)新增技能只需添加文件+配置,无需
本文介绍了如何将AI Agent封装为HTTP服务,实现统一接口调用。首先定义了BaseAgent抽象基类,要求所有具体Agent实现统一的handle方法;然后通过AgentRegistry集中管理Agent实例;接着使用FastAPI框架将Agent功能暴露为POST /agent/infer接口,并添加/agent/list和/health辅助接口。这种封装方式使得不同项目可以通过HTTP请
MCP技能是指通过模型上下文协议(MCP)为智能体提供的外部工具能力集合。MCP作为统一标准协议,允许智能体安全访问各类资源:包括数据源(数据库/搜索引擎)、应用(GitHub/Jira)和工具(代码执行/支付接口)。这些通过MCP暴露的工具能力构成了智能体的"技能包",包括基础能力(代码执行/搜索)、云服务集成(GCP)、第三方SaaS工具(GitHub/Stripe)以及自
文章摘要:本文提出一套企业引入Agent技术的四阶段落地路线图:1)单点试验阶段,用最小成本验证Agent价值;2)场景化落地阶段,聚焦单一高价值场景深度打磨;3)体系化建设阶段,构建可复用的Agent基础设施;4)平台化阶段,打造企业级Agent能力中台。每个阶段都明确了核心目标、实施建议和需避免的过度设计,强调从"点"到"线"再到"面"
摘要: 多Agent架构适用于复杂任务、多专业领域协作或高扩展性需求的场景,而简单任务则更适合单体Agent+工具链的轻量方案。决策时应考虑三个维度:任务复杂度(是否可分解)、领域数量(是否需要多专长)和非功能约束(延迟、成本等)。典型适用多Agent的场景包括天然多角色的流程(如运维排障)、跨领域专家系统(如企业助手)和中台类可插拔扩展需求。建议采用渐进式演进路径:从单体Agent模块化开始,逐
本文提出构建多模态运维Agent的创新思路,将可视化监控数据(时序图、拓扑图、抓包图)与日志文本结合,利用多模态大模型实现智能故障诊断。文章详细设计了系统架构,包含截图采集、上下文构建和多模态分析三大模块,并规范了输入输出接口。重点阐述了从Grafana等监控系统获取图表截图的技术方案,以及如何组织"图表+日志"的上下文信息。通过结构化Prompt设计,使Agent能输出包含异
本文介绍了如何通过偏好对齐(preference alignment)技术,使RAG模型从“不犯错”进阶到“更符合业务偏好”。作者提出在现有质量闭环系统基础上增加“偏好环”,通过质量事件自动生成(prompt, chosen, rejected)样本对,并采用DPO等轻量级RLHF方法进行微调。具体实现包括:1)设计偏好样本生成器,针对不同错误类型制定改进策略;2)构建标准化prompt格式;3)
本文提出了一套完整的RAG系统监督微调(SFT)方案,通过将质量事件自动转化为训练数据,实现系统自我优化。方案包含四个关键环节:1) 质量事件落盘存储低分样本;2) 基于错误标签自动清洗标注数据;3) 采用两种策略生成训练样本(prompt/completion对);4) 设计RAG专用训练策略,包括样本权重、标签权重和损失函数加权。特别针对RAG特有的错误类型(事实性、完整性、相关性、过度自信)
本文提出了一种将RAG系统中的低质量回答自动转化为可微调数据集的闭环方案,使模型能够通过持续学习不断提升性能。系统通过三类专用Agent(检索、解释、评估)识别低分样本并生成结构化质量事件,经过四个关键处理阶段:1)采集问题、文档、答案和评估结果;2)基于评估标签自动识别错误类型并生成纠正指令;3)构造包含prompt、completion和置信度评分的训练样本;4)将数据接入微调管道。该方案特别







