2301_80387635 个人主页

@2301_80387635

2301_80387635

2024-12-08 11:10:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

23级山东大学软件学院创新实训-个人纪录（五）——灵语星火实训项目：Stable Diffusion 远程服务器部署与测试

一、扩散模型（Diffusion Model）简介扩散模型是一类受非平衡热力学启发的生成模型。它的核心思想分为两个过程：前向扩散过程（Forward Process）向一张真实图像逐步添加高斯噪声，经过足够多的步骤后，图像完全退化为纯噪声。这个过程是固定的，不需要学习。反向去噪过程（Reverse Process）训练一个神经网络（通常是 U-Net）来预测每一步添加的噪声，从而将纯噪声逐步还原成

#服务器 #人工智能

23级山东大学软件学院创新实训-个人纪录（五）——灵语星火实训项目：Stable Diffusion 远程服务器部署与测试

#服务器 #人工智能

23级山东大学软件学院创新实训-个人纪录（四）——灵语星火实训项目：Qwen3-8B 口语对话模型 SFT + DPO 训练与评估脚本全解析

本文记录我在“灵语星火”实训项目中，基于 Qwen3-8B 完成英语口语共情对话模型微调的全部脚本代码讲解。内容涵盖 SFT 监督微调、DPO 偏好对齐以及测试集评估三个核心脚本，我会详细说明每一段代码的设计思路、关键参数和踩坑经验。

#python #人工智能 #深度学习

23级山东大学软件学院创新实训-个人纪录（二）口语对话模型微调设计方案：基于 Qwen3-8B 的口语对话训练规划

本文档详细记录了我在灵语星火团队中为口语对话模型微调所做的设计方案。目前项目处于设计阶段，已完成数据接入分析、清洗规则制定、样本构造模板设计、两阶段训练流程规划、超参预设、损失函数设计、质量控制计划和部署方案。所有设计均基于单卡 RTX 4090（24GB）（实际上我们还可能调用 L40显卡）的实际资源约束，并预留了动态调整空间。以上是我在 LingualSpark 口语对话能力微调任务中的完整设

#人工智能

到底了