2501_93718679 个人主页

@2501_93718679

2501_93718679

2025-10-10 16:27:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

系列教程三：BitaHub上部署qwen2大模型web app实践

本教程将在上一篇文章的基础上，进一步指导您如何在Bitahub平台上部署大模型Web服务，并实现本地访问。这个里面包含了下面需要的ncat文件，下载地址是https://nmap.org/download.html。这个里面port是web服务的端口号，localport是本地端口号，host是docker的机器号。在文件的设置-安全里面改成当前用户的独有权限，删除其他用户权限。模型 web代码文

#web app

系列教程七 | 基于 GRPO 算法微调Qwen2.5-7B实现R1推理能力

为进一步优化推理能力，本教程介绍如何在 Bitahub 平台上通过 GRPO 算法（一种比 PPO 更高效的在线强化学习算法）对 Qwen2.5-7B 模型进行全参数微调。本教程使用 GRPO 算法在 Math 数据集上对 Qwen2.5-7B 模型进行了全参数微调，并取得了一定的初步效果。在新疆集群创建开发任务，模型选择是qwen2.5-7b,机器选4卡A100机器，镜像选择的是pytorch的

#算法 #人工智能 #机器学习

系列教程二｜微调大模型Yi-1.5-6B-Chat

在命令行操作里，许多后续的指令都需要在项目的根目录下执行，只有进入到这个特定的目录，才能确保后续对项目文件和代码的操作是有效的。通过这一步，我们就为模型微调指定了正确的起点。Yi-1.5-6B-Chat 就是其中一款备受瞩目的模型，它基于 60 亿参数打造，在多种自然语言处理任务中表现出色，能够与用户进行高质量的对话交互，理解复杂的语义并给出精准回复。通过加载微调后的模型进行推理，我们能直接观察模

#深度学习

系列教程十 | 基于 Wav2Vec2 的语音特征提取与识别实战教程

该任务的目标是通过对模型的合理运用，精准提取语音特征并将语音转换为文本，进而提升在语音识别、语音内容分析、有声读物转文字等领域的工作效率和应用效果。通过模型提取语音特征并可视化，进而完成语音转文本任务，成功将语音转换为对应的文本内容。绘制模型分类结果的图像，横坐标为时间轴上的帧，纵坐标为类别，通过图像可以直观地观察模型对语音数据不同帧的分类情况。将模型输出转换为可读文本，取每一时间帧概率最高的标签

#语音识别

系列教程六| 微调 Qwen2-VL：实现 LaTeX 公式 OCR 识别！

该任务的目标是使模型能够精准识别数学公式，并将其转换为可编辑的 LaTeX 代码，从而提升数学、科研、教育等领域的公式解析和编辑效率。项目使用了 Qwen2-VL-2B-Instruct 模型，Qwen2-VL系列是基于Qwen-VL框架的大规模视觉语言模型，能够动态处理不同分辨率的图像和视频，支持多语言理解和设备操作。为了微调模型，项目使用了 LoRA（Low-Rank Adaptation）

#深度学习 #python #pytorch

系列教程八 | Gemma-3-4B 高效微调指南

使用unsloth库中的FastModel.get_peft_model方法，对已经加载好的model应用参数高效微调（PEFT, Parameter-Efficient Fine-Tuning）技术，通过设置不同的微调参数，让模型能在特定任务上进行更高效的微调，同时减少需要训练的参数数量，降低计算成本和内存需求。项目涵盖环境搭建、模型加载与量化、参数微调设置、聊天模板应用、数据集处理、模型训练与

#数据库 #深度学习

系列教程四 | BLIP 模型在自定义图像描述数据集上的微调

我们将使用一个示例数据集，该数据集包含足球球员的图像和相应的标注文本。通过本教程，你将学会如何将自己的图像-文本数据集上传到 BitaHub 平台，加载和处理数据，以及在BitaHub 平台上进行模型微调。1.通过datasets库加载已上传的足球运动员数据集，执行上述代码时，会显示数据集的加载进度，完成后数据集就准备就绪。可以在BitaHub主页下载此次训练所需要的模型和数据集，并将其存入刚刚创

#深度学习

系列教程九 | LLaMA Factory框架微调GLM-4大模型

本项目旨在借助LLaMA Factory 框架，在 BitaHub 平台上，运用 LoRA 微调方法对 GLM-4-9B-Chat 模型进行针对性训练。该项目的目标是让模型在广告文案生成任务中，能够深度理解不同的产品特点和风格需求，生成极具吸引力且风格独特的广告文案，实现精准的风格迁移，进而提升在广告营销、内容创作等领域的应用价值。在模型训练完成后，将基础模型（GLM-4-9B-Chat ）与经过

到底了