坤坤爱学习2.0 个人主页

坤坤爱学习2.0

2025-05-13 02:41:37 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

本文重点介绍使用微调框架unsloth，围绕DeepSeek R1 Distill 7B模型进行高效微调，并介绍用于推理大模型高效微调的COT数据集的创建和使用方法，并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战，并最终达到问答风格优化&知识灌注目的。

到底了