logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

构建AI Agent的沙盒测试环境

概念定义AI Agent沙盒测试环境专门为AI Agent设计的隔离式测试环境,具备运行隔离、工具仿真、幻觉检测、风险度量、场景编排五大核心能力,在完全不触碰生产资源的前提下,模拟真实业务场景对Agent的功能、安全性、合规性、鲁棒性进行全面验证运行隔离对Agent的进程、网络、数据访问进行完全隔离,禁止访问公网、生产资源,测试结束后所有临时资源自动销毁工具仿真层。

#人工智能#大数据
教你的 Agent 玩游戏

你有没有过这种好奇:王者荣耀里的AI队友为啥能精准放技能?OpenAI的AI玩DOTA2能打赢职业选手?甚至现在的AI能自己在《我的世界》里建房子?这些能自主玩游戏的AI,本质就是我们今天要聊的「Agent(智能体)」。本文的核心目的是让所有有基础Python编程能力的读者,都能搞懂Agent玩游戏的底层逻辑,并且亲手训练出一个能自主玩Flappy Bird的AI。

#玩游戏
AI Agent的异常检测能力

随着云原生、微服务、分布式架构的普及,企业IT系统的复杂度呈指数级上升,传统阈值告警、规则引擎驱动的异常检测方案已经完全无法适配当前的运维需求:高达70%以上的误报率让运维人员陷入"告警疲劳",平均故障恢复时间(MTTR)长期停留在小时级,每年给全球企业造成超过1.7万亿美元的经济损失。

Multi-Agent 适合 B 端还是 C 端?价值密度分析

在人工智能技术,特别是大语言模型 (LLM) 飞速发展的今天,“Multi-Agent”(多智能体)系统无疑是最具吸引力的技术方向之一。它承诺通过多个智能体之间的协作、竞争与通信,解决单一 LLM 难以处理的复杂任务。Multi-Agent 技术的第一片沃土究竟是在壁垒森严、流程复杂的 B 端(企业级市场),还是在场景丰富、用户海量的 C 端(消费者市场)?更进一步,如何衡量在不同场景下的“价值密

Harness 中的结果验真:交叉验证多个 Agent 输出

识别框架ΘC¬CΘC¬C,其中C代表待验证的结论(比如"代码存在SQL注入漏洞"),¬C\neg C¬C代表结论不成立,Θ\ThetaΘ代表不确定;基本概率分配(BPA):每个Agent输出一个BPA函数m2Θ→01m2Θ→01,满足m∅0m∅0∑A⊆ΘmA1∑A⊆Θ​mA1;Dempster组合规则mA∑A1∩A2∩∩AnA∏i1nmiAi1−KmA1−K∑。

实用教程:用CrewAI构建一个内容生成流水线

9.3 Crew定义的核心参数解析(agents、tasks、process、manager_llm、memory、verbose、max_rpm、full_output)9.1 Agent定义的核心参数解析(role、goal、backstory、tools、llm、memory、verbose、allow_delegation)13.2 流水线的扩展方向(知识库检索、多语言翻译、视频脚本生成、

DeepEval:评估 Agent Harness 表现的开源工具

你有没有过这样的经历:花了半个月做了一个企业内部智能客服Agent,上线第一天就被用户投诉:问“5月的考勤怎么补卡”,它居然调用了工资发放的接口,返回了一堆无关的工资数据;问“年假有多少天”,它编了个15天的假规则,实际公司规定是入职满1年才有5天。这些问题90%都出在Agent Harness层——也就是智能体的“交互执行外壳”,它负责解析用户任务、选择调用的工具、处理工具返回结果、聚合最终回答

#开源
深度解析 Agent 的“工具箱”:Code Interpreter 的原理与安全沙箱

在大语言模型(LLM)驱动的智能应用浪潮中,Code Interpreter(代码解释器)已从ChatGPT的“隐藏杀手功能”演变为各类Agent不可或缺的核心“工具箱”:它能让只会“说人话”的LLM具备直接操作数据、编写脚本、执行计算、生成可视化图表、甚至调试代码的能力,彻底打破了大语言模型的“静态理解”瓶颈。然而,“能执行代码”的特性既是Code Interpreter的“超能力”,也如同一把

#安全
深度解析 Agent 的“工具箱”:Code Interpreter 的原理与安全沙箱

在大语言模型(LLM)驱动的智能应用浪潮中,Code Interpreter(代码解释器)已从ChatGPT的“隐藏杀手功能”演变为各类Agent不可或缺的核心“工具箱”:它能让只会“说人话”的LLM具备直接操作数据、编写脚本、执行计算、生成可视化图表、甚至调试代码的能力,彻底打破了大语言模型的“静态理解”瓶颈。然而,“能执行代码”的特性既是Code Interpreter的“超能力”,也如同一把

#安全
AI Agent的联邦学习:保护隐私的分布式智能

感知层:接收环境输入(比如用户提问、传感器数据);记忆层:存储历史交互数据、知识库、经验数据;规划层:根据当前输入和记忆,拆解目标、制定执行计划;动作层:调用工具、输出结果、影响环境。多Agent协同场景下,多个Agent之间可以通过通信模块共享信息,共同完成复杂任务。本文系统介绍了AI Agent和联邦学习结合的FedAgent方案,核心价值是解决AI Agent跨机构、跨终端协同的隐私痛点,实

#人工智能#分布式
    共 432 条
  • 1
  • 2
  • 3
  • 44
  • 请选择