logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LoRA微调Qwen2.5-1.5B-instruct实践

模型要输出正确的「负向」,必须先理解前面的「system 指令」和「user 点评」—— 如果只把 labels 的「负向」部分保留,删掉前面的 system/user 部分,模型会失去上下文,根本不知道要做什么(比如模型看到「负」,但不知道为什么要输出「负」)。

#机器学习#人工智能#深度学习 +2
到底了