logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM学习笔记7——unsloth微调Qwen3-4B模型与vllm部署测试

本文介绍了使用Unsloth库高效微调Qwen3-4B大模型的方法。

文章图片
#学习#语言模型#人工智能
LLM学习笔记7——unsloth微调Qwen3-4B模型与vllm部署测试

本文介绍了使用Unsloth库高效微调Qwen3-4B大模型的方法。

文章图片
#学习
杂谈3——深度学习中使用GPU的建议

深度学习是一个对计算有着大量需求的领域,从一定程度上来说,GPU的选择将从根本上决定深度学习的体验。但问题来了,如何选购合适的GPU也是件头疼烧脑的事。怎么避免踩雷,如何做出性价比高的选择?

文章图片
#深度学习#人工智能
杂谈1——深度学习简易知识积累

浅浅记录一些知识,一方面做一些分享与自己的思考,另一方面作为笔记记录下来。

文章图片
#深度学习#人工智能
杂谈3——深度学习中使用GPU的建议

深度学习是一个对计算有着大量需求的领域,从一定程度上来说,GPU的选择将从根本上决定深度学习的体验。但问题来了,如何选购合适的GPU也是件头疼烧脑的事。怎么避免踩雷,如何做出性价比高的选择?

文章图片
#深度学习#人工智能
问题记录——TypeError: buffer is too small for requested array

查了很多地方,对此有很多原因可以造成这种报错,比如:1、cfg文件与模型文件不匹配2、文件名或者路径名不合规导致3、模型训练时,数据缺失4、onnx的操作符不完整。

文章图片
#python#深度学习#神经网络
到底了