logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 Qwen-0.5B Lora 微调训练英语问答任务

Qwen是阿里巴巴集团的Qwen团队研发的一个大语言模型系列,包含了语言模型和多模态模型。本文是使用了Lora微调的方法对qwen进行微调,使得模型在自己的数据集上更加准确

文章图片
#人工智能#机器学习#深度学习
Qwen大模型简介

Qwen是由阿里巴巴集团达摩院开发的一个开源大语言模型系列。该系列模型专注于多任务场景下的自然语言处理(NLP),并提供了优秀的多模态扩展能力。Qwen模型家族包括多个版本,如等,分别适用于不同的计算资源和应用场景。启元系列不仅有纯文本语言模型,还包括支持图像、文本、对话等多模态输入的模型。

#python
到底了