logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Attack via Overfitting: 10-shot Benign Fine-tuning to Jailbreak LLMs

尽管在安全对齐(safety alignment)方面已投入了大量研究努力,近期的研究仍表明,大型语言模型(LLMs)依然极易受到jailbreak 攻击的威胁。在众多攻击方式中,基于微调(fine-tuning)的攻击因其稳定的越狱效果而尤为突出。尤其是,有研究表明,仅使用10 个有害的问答(QA)样本进行微调,就可以使模型在多种有害问题上成功越狱。然而,这类恶意微调攻击通常容易被内容审查模型检

#人工智能#机器学习
【VulBot】

VulnBot 的整体架构如图 2 所示。VulnBot 是一个自主的渗透测试框架,旨在模拟人类渗透测试团队的协作和策略性工作流程。系统围绕五个核心模块构建:计划器(Planner)、记忆检索器(Memory Retriever)、生成器(Generator)、执行器(Executor) 和 总结器(Summarizer),共同自动化实现渗透测试的三个主要阶段:信息侦察(Reconnaissanc

#网络#安全
【DecEx-RAG】

提出 DecEx-RAG 框架:将 RAG 建模为马尔可夫决策过程(MDP),为 Agentic RAG 系统提供了更全面、统一的建模视角。提出剪枝策略:优化数据扩展过程,在不降低数据质量的前提下显著提升过程监督数据构建效率。实验验证:在六个数据集上,在相同规模的训练数据下,DecEx-RAG 的整体性能显著优于现有基线方法。是否希望我将这一中文版本润色为正式的论文摘要风格(例如可直接放入学术论文

【数据结构】-哈夫曼树以及其应用

哈夫曼树(Huffman Tree)是一种,常用于数据压缩和最优前缀编码。其目标是使得。在信息论和计算机科学中,哈夫曼编码是一种,用于构造哈夫曼树,以实现。

文章图片
#数据结构#霍夫曼树
ComfyUI姿态自适应调整工作流

Comfyui姿态自适应姿态调整工作流

文章图片
#AI作画#神经网络#机器学习 +4
【笔记】对抗训练-GAN

内容含义D∗xPrxPrxPgxD∗xPr​xPg​xPr​x​判别器在每个样本点处的最优输出GAN 的优化目标最小化 JS 散度最优时的结果当PrPgP_r = P_gPr​Pg​时,GAN 达到最优,Dx0.5D(x)=0.5Dx0.5,分不出真假。

文章图片
【笔记】激活函数SiLU和Swish

Swish 函数在实践中已经证明了其有效性,特别是在深度神经网络中。它既有 ReLU(Rectified Linear Unit)激活函数的一些优点(例如,能够缓解梯度消失问题),又能解决 ReLU 函数的一些缺点(例如,ReLU 函数不是零中心的,且在负数部分的梯度为零)。此外,Swish 函数还是平滑函数,这意味着它在整个定义域内都有导数,这有利于优化。可以看做是平滑的ReLU激活函数。SiL

文章图片
#深度学习#机器学习#人工智能
到底了