暗黑小白个人主页

@tan_tan_1

暗黑小白

2023-03-08 11:22:22 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

混沌工程与稳定性保障：主动发现系统的脆弱点

传统混沌工程注入网络延迟、杀节点。AI Agent 还多一类模型层故障：模型返回格式错乱、超时、限流、给出矛盾结论。这类故障频率高、影响隐蔽（不 500 但答非所问），却很少被写进混沌实验。降级路径本身可能没被测过。你说"模型挂了走本地兜底"，但没人真杀过模型，那条路径可能根本跑不通——这就是混沌工程要揭的"纸糊韧性"。上一节定了故障类型，动手前必须先定义稳态——系统正常时长什么样，才能判断注入后

#人工智能

混沌工程与稳定性保障：主动发现系统的脆弱点

#人工智能

Agent 运行时与 Harness：从教科书循环到生产级运行时

生产级AI Agent框架的核心不是简单的"思考-行动-观察"单循环，而是由路由层、多策略执行器和生产守卫构成的三层结构。路由层负责请求预处理和意图分发，执行器针对不同任务类型（自由循环/固定步骤/直接分发）提供专门处理，守卫则通过前置的安全检查、流量控制和状态监控确保系统可靠性。关键创新点包括：递归上限作为循环断路器、状态存档支持人工干预、多执行器按复杂度分级处理，以及将安全与可观测性直接编织进

#人工智能

Agent 运行时与 Harness：从教科书循环到生产级运行时

#人工智能

第六篇：本地模型选型 —— 4 个模型 × 2 种设备 × 2 项任务的全量对比

摘要模型选型应遵循"刚好够用且最省资源"原则。实验对比了不同规模的Qwen模型在信息提取（要求<500ms）和工具选择（要求<100ms）任务中的表现。结果显示：信息提取：Qwen3-1.7B和Qwen2.5-3B在GPU上均实现100%值匹配率，但0.5B/1.5B存在编造字段问题。工具选择：3B模型以96%准确率最优，1.5B达92%，0.5B仅56%-58%。硬件：GPU加速比达4.

#架构

分布式挑战：老问题的新形态

摘要：客服Agent面临的分布式问题具有新形态——LLM调用长耗时改变并发模型，多Agent并行导致部分失败常态化，锁保护对象变为跨LLM调用的业务流程。具体表现为：锁保护业务实例而非数据行，部分失败呈现为语义半成品，故障沿角色链传播。与传统Web服务不同，Agent系统先耗尽连接池而非CPU，CAP选择偏向AP以保证可用性。架构上通过编排层实现并行协调，分布式锁防重入，共享依赖需隔离抖动风险。

#人工智能

LLaMA-Factory 微调 Qwen2.5-1.5B 参数抽取：流程与踩坑实录

本文详细记录了基于LLaMA-Factory微调Qwen2.5-1.5B模型用于电商场景参数抽取的全过程。通过离线合成数据（1729条训练样本）和QLoRA 4bit量化技术，在8GB显存设备上完成训练，将参数抽取命中率从23.3%提升至97.8%，显著降低云端大模型调用成本。文章重点剖析了参数抽取领域的九大特有难题（如资损字段处理、类型强约束等），并分享了模板一致性、数据增强等关键踩坑经验。采用

#java #人工智能

LLaMA-Factory 微调 Qwen2.5-1.5B 参数抽取：流程与踩坑实录

#java #人工智能

数字员工之间怎么沟通？——A2A 通信协议设计

《数字员工间通信协议设计：从私有胶水到标准A2A》摘要：本文探讨了数字员工间标准化通信的必要性，提出A2A（Agent-to-Agent）通信协议解决方案。通过分析硬编码调用、共享数据库和信息孤岛三种失败模式，揭示了现有通信方式的弊端。A2A协议采用异步任务模式，包含任务提交、状态查询、回调注册等核心端点，实现数字员工间的解耦协作。shop-agent项目的实践表明，该架构能有效避免同步调用的级

#人工智能

多个数字员工怎么分工？——从 DisputeCoordinator 看多数字员工协作模式

摘要：多数字员工协作需要明确的角色分工与仲裁机制。本文以DisputeCoordinator为例，分析了三种失败模式：全能数字员工过载、无协作协议导致推诿、无仲裁机制引发决策瘫痪。解决方案采用四角色协作框架：FactCollector（事实收集）、BuyerAgent与SellerAgent（并行分析立场）、MediatorAgent（仲裁裁决），通过串行+并行执行提升效率。该模式适用于纠纷类请

#网络 #人工智能

共 27 条

请选择