
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要: 随着AI Agent的发展,其功能已从单纯文本生成扩展到调用工具、执行操作等,安全风险也随之升级。传统依赖Prompt的安全策略存在局限,攻击者可通过提示词注入、间接注入等手段绕过防御。文章提出分层防护方案:1)输入/输出安全检查;2)工具调用权限控制;3)RAG内容可信度过滤;4)长期记忆的冲突检测与衰减;5)多轮对话主题漂移监控。作者开发了独立中间件AIShield,通过确定性规则

文章摘要: 随着AI Agent的发展,其功能已从单纯文本生成扩展到调用工具、执行操作等,安全风险也随之升级。传统依赖Prompt的安全策略存在局限,攻击者可通过提示词注入、间接注入等手段绕过防御。文章提出分层防护方案:1)输入/输出安全检查;2)工具调用权限控制;3)RAG内容可信度过滤;4)长期记忆的冲突检测与衰减;5)多轮对话主题漂移监控。作者开发了独立中间件AIShield,通过确定性规则

文章摘要: 随着AI Agent的发展,其功能已从单纯文本生成扩展到调用工具、执行操作等,安全风险也随之升级。传统依赖Prompt的安全策略存在局限,攻击者可通过提示词注入、间接注入等手段绕过防御。文章提出分层防护方案:1)输入/输出安全检查;2)工具调用权限控制;3)RAG内容可信度过滤;4)长期记忆的冲突检测与衰减;5)多轮对话主题漂移监控。作者开发了独立中间件AIShield,通过确定性规则

文章摘要: 随着AI Agent的发展,其功能已从单纯文本生成扩展到调用工具、执行操作等,安全风险也随之升级。传统依赖Prompt的安全策略存在局限,攻击者可通过提示词注入、间接注入等手段绕过防御。文章提出分层防护方案:1)输入/输出安全检查;2)工具调用权限控制;3)RAG内容可信度过滤;4)长期记忆的冲突检测与衰减;5)多轮对话主题漂移监控。作者开发了独立中间件AIShield,通过确定性规则








