
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
文本水印知识总结
(1)不同文本水印技术的概述和比较;(2)文本水印算法的评价方法,包括可检测性、对文本的影响或LLM质量的影响、目标攻击的鲁棒性或非目标攻击;(3)文本水印技术的潜在应用场景;(4)文本水印的当前挑战和未来方向。大语言模型(large language models,LLMs)的迅速发展,产生了一下问题:(1)LLM 的误用:恶意用户可以利用 LLM 来创建错误信息 [13] 或有害内容 [76]

模型水印知识框架
Uchida等人的工作在共谋攻击中存在弱点,因此,提出了一种由用户和模型共同确定的端到端系统指纹框架DeepMarks.DeepMarks在保证模型性能不会大幅下降的基础上每个用户分配一个唯一的二进制代码向量(也称为指纹),并将指纹信息嵌入模型权重的概率分布中,能够有效地跟踪每个用户模型的使用情况.[74]由于在模型的内部权重中嵌入水印容易被攻击者移除和检测,从而使所有权保护失效,因此,研究者提出

到底了







