logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

系列教程七 | 基于 GRPO 算法微调Qwen2.5-7B实现R1推理能力

为进一步优化推理能力,本教程介绍如何在 Bitahub 平台上通过 GRPO 算法(一种比 PPO 更高效的在线强化学习算法)对 Qwen2.5-7B 模型进行全参数微调。本教程使用 GRPO 算法在 Math 数据集上对 Qwen2.5-7B 模型进行了全参数微调,并取得了一定的初步效果。在新疆集群创建开发任务,模型选择是qwen2.5-7b,机器选4卡A100机器,镜像选择的是pytorch的

#算法#人工智能#机器学习
系列教程二|微调大模型Yi-1.5-6B-Chat

在命令行操作里,许多后续的指令都需要在项目的根目录下执行,只有进入到这个特定的目录,才能确保后续对项目文件和代码的操作是有效的。通过这一步,我们就为模型微调指定了正确的起点。Yi-1.5-6B-Chat 就是其中一款备受瞩目的模型,它基于 60 亿参数打造,在多种自然语言处理任务中表现出色,能够与用户进行高质量的对话交互,理解复杂的语义并给出精准回复。通过加载微调后的模型进行推理,我们能直接观察模

文章图片
#深度学习
系列教程十 | 基于 Wav2Vec2 的语音特征提取与识别实战教程

该任务的目标是通过对模型的合理运用,精准提取语音特征并将语音转换为文本,进而提升在语音识别、语音内容分析、有声读物转文字等领域的工作效率和应用效果。通过模型提取语音特征并可视化,进而完成语音转文本任务,成功将语音转换为对应的文本内容。绘制模型分类结果的图像,横坐标为时间轴上的帧,纵坐标为类别,通过图像可以直观地观察模型对语音数据不同帧的分类情况。将模型输出转换为可读文本,取每一时间帧概率最高的标签

#语音识别
系列教程六| 微调 Qwen2-VL:实现 LaTeX 公式 OCR 识别!

该任务的目标是使模型能够精准识别数学公式,并将其转换为可编辑的 LaTeX 代码,从而提升数学、科研、教育等领域的公式解析和编辑效率。项目使用了 Qwen2-VL-2B-Instruct 模型,Qwen2-VL系列是基于Qwen-VL框架的大规模视觉语言模型,能够动态处理不同分辨率的图像和视频,支持多语言理解和设备操作。为了微调模型,项目使用了 LoRA(Low-Rank Adaptation)

#深度学习#python#pytorch
系列教程八 | Gemma-3-4B 高效微调指南

使用unsloth库中的FastModel.get_peft_model方法,对已经加载好的model应用参数高效微调(PEFT, Parameter-Efficient Fine-Tuning)技术,通过设置不同的微调参数,让模型能在特定任务上进行更高效的微调,同时减少需要训练的参数数量,降低计算成本和内存需求。项目涵盖环境搭建、模型加载与量化、参数微调设置、聊天模板应用、数据集处理、模型训练与

#数据库#深度学习
系列教程四 | BLIP 模型在自定义图像描述数据集上的微调

我们将使用一个示例数据集,该数据集包含足球球员的图像和相应的标注文本。通过本教程,你将学会如何将自己的图像-文本数据集上传到 BitaHub 平台,加载和处理数据,以及在BitaHub 平台上进行模型微调。1.通过datasets库加载已上传的足球运动员数据集,执行上述代码时,会显示数据集的加载进度,完成后数据集就准备就绪。可以在BitaHub主页下载此次训练所需要的模型和数据集,并将其存入刚刚创

#深度学习
系列教程九 | LLaMA Factory框架微调GLM-4大模型

本项目旨在借助LLaMA Factory 框架,在 BitaHub 平台上,运用 LoRA 微调方法对 GLM-4-9B-Chat 模型进行针对性训练。该项目的目标是让模型在广告文案生成任务中,能够深度理解不同的产品特点和风格需求,生成极具吸引力且风格独特的广告文案,实现精准的风格迁移,进而提升在广告营销、内容创作等领域的应用价值。在模型训练完成后,将基础模型(GLM-4-9B-Chat )与经过

到底了