logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

linux下安装JRE

地址:https://www.java.com/zh-CN/download/manual.jsp。从上面找到Linux x64,即可下载到本地。拷贝文件到/usr/local/java。从本地上传到服务器目录。

文章图片
#linux#运维#服务器
paraformer-large模型参数及结构

3. paraformer-large模型结构定义代码。1. paraformer-large模型参数。2. paraformer-large模型结构。

文章图片
#深度学习#人工智能
深度模型训练错误

以前跑的时候不报错,隔了几个月跑报错了。

文章图片
#深度学习#python#pytorch
Qwen及Qwen-audio大模型微调项目汇总

以上的项目,目前只有SWIFT框架支持Qwen-audio的微调。

#语言模型
Qwen及Qwen-audio大模型微调项目汇总

以上的项目,目前只有SWIFT框架支持Qwen-audio的微调。

#语言模型
SWIFT介绍和学习(简单入门级别)

SWIFT(可扩展的轻量级微调基础设施)是一个可扩展的框架,旨在促进轻量级模型的微调和推理。它通过采用参数高效、内存高效和时间高效的方法,集成了各种高效微调方法的实现。SWIFT无缝集成到ModelScope生态系统中,并提供微调各种模型的能力,主要侧重于LLM和视觉模型。此外,SWIFT与PEFT完全兼容,使用户能够利用熟悉的PEFT接口来微调ModelScope模型。可以支持的微调方法及具体使

文章图片
#swift#学习#开发语言
    共 11 条
  • 1
  • 2
  • 请选择