
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本次教程介绍了如何使用 LLaMA Factory 框架,基于全参方法微调 Qwen2-VL-2B-Instruct 模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。你只需要有一台24GB显存的GPU即可操作。

本文展示了如何基于 ms-swift 框架,在单卡环境下使用 Qwen2.5-0.5B-Instruct 模型进行 GRPO 训练。通过对比 colocate 与 独立 server 模式,可以看到前者更适合单 GPU 调试场景,而后者更适合分布式高吞吐训练。

本文展示了如何基于 ms-swift 框架,在单卡环境下使用 Qwen2.5-0.5B-Instruct 模型进行 GRPO 训练。通过对比 colocate 与 独立 server 模式,可以看到前者更适合单 GPU 调试场景,而后者更适合分布式高吞吐训练。

本文介绍了使用SWIFT框架对Qwen2.5-3B-Instruct模型进行微调的完整流程。训练完成后,在交互式推理测试中,模型能够正确回答问题,并按要求生成带注释的示例代码(如快速排序实现)。
这篇博客比较适合新手,基础知识讲得比较全面。写了两天,记录一下。

百度发现,应该是浏览器的问题,然后我着手更新edge浏览器,但是又报错“无法连接到Internet。如果使用防火墙,请将MicrosoftEdgeUpdate.exe加入允许列表中”在任务栏的搜索框中输入“cmd”,右键点击命令提示符,选择以管理员身份运行,在管理员:命令提示符窗口中执行以下的命令:netsh winsock reset回车,然后重启电脑。在Microsoft Community找
工具:texstudio(软件)或者Overleaf(网页,可多人共享操作)(都是免费)










