Cats__ 个人主页

@Cats__

Cats__

2025-11-03 15:16:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

抢先看！一文剖析Black Hat Europe 2025上的8款AI安全“神器”

引言2025年12月，全球网络安全界的年度盛会Black Hat Europe 2025即将在英国伦敦拉开帷幕。作为Black Hat系列活动中技术风向标的Arsenal（兵器谱）展示区，历来是安全研究者和从业者洞察未来趋势的焦点，这里汇集了全球最前沿的开源安全工具与创新理念。本文全面剖析了将在Black Hat Europe 2025 Arsenal展示的8款开源AI安全工具，帮助大家提前了解它

#人工智能

大模型越狱行为背后的安全逻辑

根据测试结果，为后续在数据筛选、规则更新和RLHF微调等环节提供具体的优化方向，从而加固"道德护栏"。其实，每一次越狱的出现，都像一次提醒：AI 的安全问题，不是“设定好就完事了”，而是需要不断打补丁、持续升级的过程。通过精心设计的提示或对话策略，尝试绕过模型内置的安全防护机制，诱导其输出通常被限制或过滤的内容。为了找出这些漏洞，开发者们组建了"红队"——就像网络安全领域的白帽黑客，专门负责攻击自

#安全

老板：AI能被扒光？我：先点star再说话（大模型HW中的AI基础设施自查）

更绝的是，有一天我发现GPU使用率居然100%满载运行，还以为是团队训练任务太多了。最近公司大模型项目搞得风生水起，我也跟着喝了点汤，每天不是在调Prompt就是在跑Fine-tuning，感觉自己走在了科技的最前沿。更过分的是，有人直接拿我们的接口刷小说，一天消费了3000刀的tokens。经历过这些"血泪教训"后，我痛定思痛，决定做一次全面的AI基础设施安全排查。有了这个工具，我对着扫描报告逐

#人工智能 #网络安全 #安全

到底了