Aaron 张浩个人主页

@weixin_44074465

Aaron 张浩

2023-04-28 11:28:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Deepseek(九)多语言客服自动化：跨境电商中的多币种、多语种投诉实时处理

摘要： DeepSeek为跨境电商提供智能客服解决方案，突破语言与时差壁垒。其多语言理解能力（支持30+语种）和商业逻辑推理可自动处理小语种投诉，如精准识别葡萄牙语中的退款诉求并生成处理建议。通过提示词设计，模型能翻译、分类工单（退款/物流/质量类），提供中英回复草案及风险预警。进阶方案可通过API实现工单自动化路由，输出结构化JSON数据提升效率。DeepSeek将卖家角色从“翻译员”升级为“决

#自动化 #运维 #人工智能

技能（Skills）：AI Agent 走向自治与落地的不可或缺的核心

人工智能的发展轨迹正经历一场根本性的演变：从被动响应人类指令的生成式AI（Generative AI），向能够自主规划、推理和执行复杂工作流的代理式AI（Agentic AI）转变。在形式化定义中，一个Agentic Skill可以被描述为一个包含四个元素的元组：S=(C,π,T,R)，即适用条件（Condition）、执行策略或工作流逻辑（Policy）、终止条件（Termination）和可复

#人工智能

技能（Skills）：AI Agent 走向自治与落地的不可或缺的核心

#人工智能

Agent Skills（一）开启智能体能力的“协议化时刻”

AI智能体能力跃迁：Agent Skills标准解析 AI智能体正经历从简单提示词到模块化知识管理的进化。Agent Skills作为开放标准，通过结构化文件夹（含核心指令、脚本、文档等）实现能力扩展，使AI能像专家一样按需加载技能。相比传统提示词，Skills具有持久存储和按需加载优势；相较于工具插件，Skills更侧重决策流程而非单纯执行。其跨平台兼容性（如Claude Code、Cursor

#人工智能

Agent Skills(五)高级进化：强化学习与代理数据协议（ADP）——智能体技能的自我进化之路

智能体能力正从静态指令执行向动态学习进化，核心技术是强化学习（RL）与代理数据协议（ADP）。ADP将复杂交互标准化为动作-观察序列，使异构技能经验可统一处理。通过ADP轨迹记录和RL训练（如GRPO算法），智能体能在模拟环境中通过"尝试-报错-反思"循环实现自修复和自反思。实验显示，经ADP微调的模型性能可超越更大参数量模型，表明技能正从文档演变为深度封装的模型参数。未来将进

#microsoft #人工智能

Agent Skills(六)ARTIST 框架：强化学习驱动的智能体自主进化之路

摘要： ARTIST框架通过强化学习实现大语言模型自主调用工具的能力，其核心是交织推理机制，支持模型在思考、工具调用和环境反馈间动态切换。采用GRPO算法和损失屏蔽技术，模型学习工具调用的逻辑而非结果。复合奖励机制（结果、格式、执行奖励）引导模型自主决策。实验显示，小型模型经ARTIST训练后涌现自我修正、按需调用和复杂规划等能力，性能超越更大模型，标志着智能体从被动执行迈向自主决策的范式转变。

#人工智能

Agent Skills(四)生态系统：跨平台支持与统一安装

Agent Skills 生态系统的兴起，标志着 AI 智能体正在从“黑盒模型”转向“可配置的专家系统”。通过统一的安装工具和开放的标准协议，我们正在构建一个全球性的程序性知识库。无论你是在 VS Code 里写代码，还是在终端调用 Claude，只需一行install，最顶尖的工程实践便能即刻归你所用。类比思考如果说 MCP 是给智能体装上了**“五官和双手”（感知数据和操作工具），那么 Age

#人工智能

Agent Skills（二）架构深度解析：渐进式披露——解决智能体“上下文膨胀”的终极方案

摘要：大模型应用开发面临上下文窗口有限性与高成本的挑战。Agent Skills规范引入渐进式披露架构，通过三层动态加载机制（元数据发现、指令激活、资源与代码执行）确保智能体仅加载当前任务相关的内容，大幅降低Token消耗。该机制结合安全沙箱设计，既能对抗模型幻觉，又能保障系统安全，实现了从"提示词工程"到"上下文工程"的范式升级，使智能体在低成本下具备处理

#人工智能

Agent Skills(三)实战指南：构建标准化的 SKILL.md——智能体能力的“上下文工程”

摘要：本文介绍了从提示词工程转向上下文工程的智能体开发方法，重点阐述了标准化 SKILL.md 的构建规范。一个完整的技能单元包含结构化目录（必须的 SKILL.md 和可选脚本/资源）、YAML元数据（定义触发关键词和权限）以及分阶段指令正文（含工作流、示例和错误处理）。通过版本控制和分发机制，技能可实现团队共享和个人复用。核心思想是将专业知识模块化，通过严谨的结构设计提升AI智能体的执行确定

#人工智能

（五）Stable Diffusion 3.5-LoRA 适配、ControlNet 与模型微调

《Stable Diffusion 3.5进阶应用指南》摘要：本文深入探讨SD 3.5的三大进阶技术：LoRA模型在Scaled FP8量化环境下的兼容性问题及解决方案；ControlNet Union工具集（包括Canny、Depth等模型）对图像结构的精准控制方法；以及基于PEFT框架的轻量化训练优势与实践配置。文章强调这些技术如何协同工作，使SD 3.5从基础生成工具转变为具备精准控制和个性

#人工智能

共 45 条

请选择