logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Multi-Agent系统的高可用架构:容灾设计、故障隔离与快速恢复方案

随着大模型技术的成熟,Multi-Agent(多智能体)系统已经从实验室原型走向金融、政务、工业等核心生产场景,但其高可用能力建设仍处于早期阶段:现有方案大多直接复用微服务高可用逻辑,忽略了Agent的有状态性、自治性、动态协作特性,导致生产环境频发“单个Agent崩溃拉垮整个集群”“网络分区引发全局状态混乱”“依赖服务故障导致全链路不可用”等问题。

#架构
从 ROI 看:什么时候只用单 Agent 更优

Agent(智能体):在LLM(大语言模型)语境下,Agent可以简单定义为一个拥有感知能力(Perception,比如获取用户输入、调用工具返回结果)、推理能力(Reasoning,比如理解上下文、制定计划、反思优化)、行动能力(Action,比如直接生成文本/代码、调用外部API/工具)的“LLM + 状态 + 工具/能力库”的组合体。单Agent系统(Single-Agent System)

#大数据
B 端企业如何用 AI Agent Harness Engineering 实现降本增效

AI Agent:具备自主感知、决策、行动能力的大模型应用,能够调用工具、完成特定任务,核心组成是:大模型、prompt指令、工具集、记忆模块。:专门面向B端场景的AI Agent全生命周期管理的工程方法论,核心是构建统一的管控层,实现Agent的编排、集成、权限管控、审计、效果度量的标准化、工程化,解决单个Agent不可控、不可靠、难集成的问题。

#人工智能#java#大数据
AI 内容审核 Agent 的局限性:理解语境与文化的巨大挑战

当前全球UGC内容日均生产量突破1.8EB,AI内容审核Agent已经成为平台内容治理的核心基础设施,渗透率高达87%,但行业平均误判率长期维持在15%-35%区间,其中78%的误判源自语境理解缺失与文化认知偏差。本文从第一性原理拆解AI审核Agent的认知底层缺陷,结合斯坦福互联网观测站2024年覆盖17个全球主流平台的调研数据,量化分析文化语境带来的审核偏差的形成机制,首次提出文化语境三层冰山

#人工智能#机器学习
AI Agent Harness Engineering 赋能GitOps:Agent配置与代码的一体化管理

我们推出了开源项目,实现了本文提出的所有能力,项目地址:https://github.com/agent-gitops/agent-gitops,目前已获得1.2k Star,被20+企业用于生产环境。

AI Agent Harness Engineering 与 Workflow 自动化的融合趋势

术语简明定义核心价值Workflow 自动化对重复、规则明确的业务流程进行可视化建模、自动化调度执行的技术体系,典型如BPM、RPA、低代码工作流引擎降低确定性流程的处理成本,提升执行效率与合规性AI Agent具备自主感知、推理决策、工具调用能力的大模型驱动的智能体,能独立完成复杂、规则模糊的任务处理不确定性场景,替代人工完成高复杂度的决策类工作针对AI Agent的全生命周期管控、适配、校验、

AI Agent Harness Engineering 安全防护:应对数据泄露与恶意使用的技术方案

AI Agent Harness(中文常称Agent执行底座/安全 harness)是连接大模型、工具集、数据源、业务系统的中间层,相当于Agent的「操作系统」:所有用户指令的解析、工具调用的编排、数据的流转、响应的生成都要经过Harness层。而Harness Engineering则是针对这个底座的设计、开发、运维、安全防护的完整工程体系。和普通LLM应用不同,Agent的核心能力是自主决策

#人工智能#安全
AI Agent Harness Engineering 安全防护:应对数据泄露与恶意使用的技术方案

AI Agent Harness(中文常称Agent执行底座/安全 harness)是连接大模型、工具集、数据源、业务系统的中间层,相当于Agent的「操作系统」:所有用户指令的解析、工具调用的编排、数据的流转、响应的生成都要经过Harness层。而Harness Engineering则是针对这个底座的设计、开发、运维、安全防护的完整工程体系。和普通LLM应用不同,Agent的核心能力是自主决策

#人工智能#安全
AI Agent Harness Engineering 的缓存策略:提升响应速度与降低成本

成本问题:大模型推理的 token 成本是固定支出,重复调用相似请求会造成大量不必要的成本浪费,万亿级调用场景下每年可产生数亿元的额外成本。延迟问题:单轮大模型推理延迟通常在 500ms-2s 之间,多轮工具调用的 Agent 响应延迟可达 5s 以上,严重影响用户体验。可靠性问题:大模型输出存在非确定性,相同请求可能返回不同结果,缓存可以将经过校验的可靠结果固化,提升输出一致性。:Agent 执

#人工智能#缓存
Tool Use不是简单调用:深度解析Agent与外部工具交互的四种失败模式

很多人对Tool Use的理解停留在“大模型生成API参数,后端调用”,但实际上工业级的Tool Use是一个包含6个核心环节的决策执行链路:fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;用户Query输入意图理解&工具选择参数生成&校验工

#交互#microsoft#人工智能
    共 538 条
  • 1
  • 2
  • 3
  • 54
  • 请选择