
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
让 AI 学会说话的味道——导向向量的在线自适应学习
现有的 LLM 导向向量(Activation Steering)都是离线提取、推理时固定的。本文提出一种基于 Hebbian 外积的在线学习方法,让导向向量能从交互反馈中自适应更新,配合双时标正则化防止漂移。设计已实现但未做定量评测,欢迎讨论。
到底了

该用户还未填写简介
暂无可提供的服务
现有的 LLM 导向向量(Activation Steering)都是离线提取、推理时固定的。本文提出一种基于 Hebbian 外积的在线学习方法,让导向向量能从交互反馈中自适应更新,配合双时标正则化防止漂移。设计已实现但未做定量评测,欢迎讨论。