logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

模型研究|扩散模型,颠覆自回归LLM,一种LLM新范式崛起?

MDLM使用现代工程技术,包括关键的tokenization(如避免D3PM的8k小词汇表)、数值稳定的实现,采用Diffusion Transformer(DiT,Diffusion Transformers)并结合旋转位置嵌入。MDLM在零样本困惑度上表现优于SEDD,在PTB、Wikitext、LM1B等数据集上表现出色,有时甚至优于自回归模型(如Lambada和科学论文数据集),得益于其基

文章图片
#回归#数据挖掘#人工智能
LLM安全 | 大语言模型越狱:白盒攻击揭秘

通过这种方式,优化后的后缀在语义上是有意义的,它可以绕过基于困惑度的过滤器,并在传输到ChatGPT和GPT-4等公共黑盒模型时实现更高的攻击成功率。『 ASETF的流程介绍:相比于GCG的优化目标是直接优化得到离散的后缀来诱导模型生成对应的恶意行为,ASETF的优化目标是连续的,也就是优化h0~hi这一段连续的嵌入层来得到"Sure,here is how to make a bomb",然而很

文章图片
#人工智能#网络攻击模型#安全 +2
LLM安全 | 大语言模型越狱:黑盒攻击揭秘

上一篇,我们探讨了越狱攻击对LLM安全性的影响,分析了不同的攻击方法,包括基于梯度、Logits和微调的技术,并讨论了它们在白盒场景中的应用。随着LLM在各领域的广泛应用,如何有效防范这些攻击已经成为一个亟待解决的课题。本文,我们将转向黑盒场景,重点分析三种主要的越狱攻击方法:基于模板补全的攻击方法、基于提示词重写的攻击方法,以及基于LLM进行生成的攻击方法。与白盒攻击的隐蔽性不同,黑盒场景下攻击

文章图片
#数据库#网络
LLM安全 | 大语言模型越狱:白盒攻击揭秘

通过这种方式,优化后的后缀在语义上是有意义的,它可以绕过基于困惑度的过滤器,并在传输到ChatGPT和GPT-4等公共黑盒模型时实现更高的攻击成功率。『 ASETF的流程介绍:相比于GCG的优化目标是直接优化得到离散的后缀来诱导模型生成对应的恶意行为,ASETF的优化目标是连续的,也就是优化h0~hi这一段连续的嵌入层来得到"Sure,here is how to make a bomb",然而很

文章图片
#人工智能#网络攻击模型#安全 +2
行业洞察| 当大模型开始协同工作:多智能体系统的崛起与挑战

人类老板直接分配(你是产品经理,你是工程师)。

文章图片
#人工智能
热门应用 | 革命性工具Browser Use 让AI化身浏览器管家 拆除人机交互最后一堵墙

当浏览器开始理解人类的语言,也许我们正在迈入一个更“懒惰”却高效的时代。

文章图片
#人工智能#人机交互#大数据 +1
技术研究 | 推荐系统训练后多分类属性遗忘:双组分损失优化与效用空间正则设计

本文聚焦于模型训练后的属性遗忘,将基于双组分损失优化的属性遗忘框架从二分类任务推广至多分类场景,显著提升了该框架在实际应用中的普适性。

文章图片
#分类#数据挖掘#人工智能 +1
模型研究|扩散模型,颠覆自回归LLM,一种LLM新范式崛起?

MDLM使用现代工程技术,包括关键的tokenization(如避免D3PM的8k小词汇表)、数值稳定的实现,采用Diffusion Transformer(DiT,Diffusion Transformers)并结合旋转位置嵌入。MDLM在零样本困惑度上表现优于SEDD,在PTB、Wikitext、LM1B等数据集上表现出色,有时甚至优于自回归模型(如Lambada和科学论文数据集),得益于其基

文章图片
#回归#数据挖掘#人工智能
MCP安全仅为冰山一角?总览智能体通信安全:通信协议、风险剖析、防御对策与前沿挑战

大型语言模型(LLM)是一种基于海量文本数据训练而成的新型人工智能(AI)模型,旨在理解和生成人类语言,其在诸多领域展现出了前所未有的能力。下图展示了一个典型的LLM驱动智能体架构。与主要作为聊天机器人且不具备特定领域专业能力的LLM不同,智能体被设计用于自动协助人类完成专业化任务。为此,智能体配备了多个模块以实现全能化:感知、记忆、工具、推理与行动。智能体内部架构高自主性:能够自主进行任务分解、

文章图片
#安全
论文解读 | 为什么大模型学会了“答题”,却不会“思考”?一文读懂清华&北大&腾讯联合提出的GTR方法!

1.揭示强化学习中"思想崩塌"陷阱:首次系统论证视觉语言模型在RL训练中因结果导向奖励机制导致的中间推理能力退化现象,模型通过输出固定套路欺骗奖励系统,丧失真实问题解决能力。2.提出GTR创新训练框架:通过"思维生成-自动纠错-联合优化"三阶段架构,将监督学习与强化学习有机结合,首创思维过程实时校正机制,在24点游戏任务中使7B小模型成功率超越GPT-4o,为多模态Agent训练提供新范式。

文章图片
#人工智能
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择