logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Datawhale大模型微调实战

本文介绍了大模型微调技术及其应用,重点阐述了参数高效微调方法(如LoRA)如何通过少量参数训练实现媲美全量微调的效果。以源2.0-2B模型为例,详细展示了在BAAI/COIG-PC-Lite数据集上进行简历命名实体识别微调的全流程,包括环境准备、模型下载、数据处理、LoRA微调训练及效果验证。通过构建AI简历助手,实现了8类关键实体信息的自动提取,显著提升简历处理效率。实验结果表明,该方法在降低算

文章图片
#python
Datawhale大模型RAG实战

本文介绍了检索增强生成(RAG)技术,通过引入外部知识解决通用大模型的知识局限、数据安全风险和模型幻觉问题。RAG流程包括离线计算(文档处理、向量化存储)和在线计算(查询处理、检索排序、生成回复)。文章基于Yuan2-2B-Mars模型搭建简化版RAG系统,详细说明环境准备、模型下载(使用bge-small-zh-v1.5向量模型)和操作步骤,帮助读者掌握RAG核心技术。完整教程可参考Datawh

文章图片
Datawhale 动手学大模型应用全栈开发教程

本内容主要为Datawhale的动手学大模型应用全栈开发教程做介绍和让人实践。

文章图片
#python
Datawhale AI夏令营 「2025全球AI攻防挑战赛-赛道一:图片全要素交互认证-生成赛」的赛事项目实践

本次比赛的挑战在于:AIGC图片生成 :模型的挑战在于如何准确理解复杂的文本描述(Prompt),并生成出既美观又真实的图片。自然场景图片编辑 :编辑后的内容需要与原图在光影、透视和纹理上完美融合,不留痕迹。视觉文本编辑 :修改后的文字必须与原图中的文字在字体、大小、光影、背景融合度等方面保持高度一致,这要求模型具备强大的文字渲染与融合能力。Deepfake :需要将源人脸的身份特征自然地迁移到目

#python#pycharm#AIGC
Datawhale AI夏令营 「结构化数据的用户意图理解和知识问答挑战赛」的赛事项目实践——大模型技术方向的学习

最近参加了datawhale夏令营的结构化数据的用户意图理解和知识问答挑战赛的赛事项目实践,基于列车信息查询与问答,传统的人工查询方式效率低下,且难以应对复杂的多条件查询需求。因此本项目将和大家一起探讨,如何用AI赋能这项工作。在基础方案中,我们掌握了如何通过模型蒸馏构建SFT数据集,并利用LoRA微调技术在讯飞星辰MaaS平台上训练出能够回答单字段查询的学生模型。但我们只回答了智能列车问答系统的

#pycharm#jupyter
到底了