
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
LoRA微调Qwen2.5-1.5B-instruct实践
模型要输出正确的「负向」,必须先理解前面的「system 指令」和「user 点评」—— 如果只把 labels 的「负向」部分保留,删掉前面的 system/user 部分,模型会失去上下文,根本不知道要做什么(比如模型看到「负」,但不知道为什么要输出「负」)。
到底了

该用户还未填写简介
暂无可提供的服务
模型要输出正确的「负向」,必须先理解前面的「system 指令」和「user 点评」—— 如果只把 labels 的「负向」部分保留,删掉前面的 system/user 部分,模型会失去上下文,根本不知道要做什么(比如模型看到「负」,但不知道为什么要输出「负」)。