logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

差分隐私与大模型+差分隐私在相关领域应用的论文总结

摘要:差分隐私随机梯度下降(DP-SGD)通过在训练过程中实施逐样本梯度裁剪、高斯噪声注入和隐私会计,实现大模型的隐私保护训练。该方法通过限制单样本影响上界(裁剪阈值C)和添加噪声(噪声倍率σ)来平衡隐私保护与模型性能。主要工具包括PyTorch的Opacus和TensorFlow Privacy,它们提供便捷的API实现DP-SGD训练流程。隐私预算计算采用RDP/Moments Account

#算法#人工智能
论文学习:《Explanation as a Watermark》

目前主流的黑盒模型水印方法,大都借鉴后门攻击(Backdoor Attack)的机制。构造一组带触发器的特殊样本,称为触发集训练模型记住这组样本当模型看到这些触发样本时,会输出特定错误结果验证时,所有者秘密提交这些触发样本,如果可疑模型也出现相同异常行为,就认为它继承了原模型的水印也就是说:传统后门水印,本质上是“通过故意制造特殊误分类行为”来留下标记。传统黑盒后门水印通常只验证一件事:对这个输入

#学习#人工智能
论文学习《RAG-WM——首个面向 RAG 的黑盒知识水印方案》

论文:RAG-WM: An Efficient Black-Box Watermarking Method for Retrieval-Augmented Generation会议:CCS 2025关键词:RAG、知识产权保护、知识水印、黑盒验证、实体关系三元组、二项检验相比传统文本水印、数据库水印或模型水印,RAG-WM 抓住的不是字面表达,而是。这让它即使面对 LLM 的复述、改写和重生成,也

#学习
论文学习《A Crack in the Bark——利用公开知识移除 Tree-Ring 水印》

论文:A Crack in the Bark: Leveraging Public Knowledge to Remove Tree-Ring Watermarks会议:USENIX Security 2025关键词:扩散模型、VAE、隐空间水印、Tree-Ring、对抗攻击、低基率检测。

#学习
OpenClaw 三种运行模式如何避免冲突:判断、切换与排障

OpenClaw 常见有三种运行方式:系统服务模式、独立进程模式、PM2 模式。三者都能启动 Gateway,但如果混用,最容易出现端口冲突、进程残留和配置错位。

#人工智能
PM2 管理 OpenClaw

PM2 是一款Node.js 应用的进程管理工具,可以理解为 Node.js 进程的 “管家”—— 它能帮你管理 Node.js 程序的启动、停止、重启、日志、监控,甚至实现崩溃自动重启、开机自启等功能。只要已有网关进程在 18789 上监听,飞书就可能继续正常响应。飞书依赖的是“网关是否可连接”,不是“启动命令是否成功”。,后续按 PM2 单一入口管理,未再出现重复启动冲突。

#人工智能
OpenClaw的一些细节理解

优先查找官方/社区现成 Agent → 无则自定义开发 → 按规范注册到 OpenClaw 系统 → 即可在聊天中调用(支持本地开发、内部上传)。

#人工智能
OpenClaw工作流

OpenClaw 是一个,它的核心是通过模块化协作,让AI从“回答问题”升级为“自主完成任务”。运行环境:Node.js 22+(跨平台:Windows/macOS/Linux/ 树莓派)模型层:对接外部 LLM(Claude 3.5/4、GPT-4o、Gemini、通义千问、Ollama 本地模型),自身不内置模型通信协议:WebSocket(持久连接)、MCP(Model Context Pr

#人工智能
图像生成水印:Stable Signature、Tree-Ring、Gaussian Shade、图像版 PRC

本文系统梳理了扩散模型中的四类图像水印技术:Stable Signature通过微调解码器嵌入固定签名;Tree-Ring在潜空间频域构造环形模式;Gaussian Shade将潜变量约束到特定子空间;图像版PRC结合伪随机码与纠错机制。这些方法均基于潜空间操作,利用其压缩特性实现水印嵌入与检测。各方案在可嵌消息、鲁棒性、实现复杂度等方面存在差异:Stable Signature检测快但需微调,T

#计算机视觉#人工智能#算法
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择