logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

llama-factory微调Qwen2.5-7B-instruct实战,看这一篇就够了!!!(含windows和linux)

llama-factory微调Qwen2.5-7B-instruct实战,看这一篇就够了!!!(含windows和linux)

文章图片
#人工智能
agent rl过程

本文研究了智能体强化学习(Agentic RL)在文本转有声书任务中的应用。实验采用微软开源的Agent Lightning框架,基于Qwen-1.5b模型进行多轮交互式训练。通过GLM-4.7作为奖励模型,对20条《天龙八部》文本片段进行格式、内容、情感等多维度评估。使用GRPO算法训练后,验证集最佳成绩达到0.552,较基线提升341%。结果表明,Agentic RL能有效提升文本转语音任务的

FlowSE

flowse项目

#人工智能
LazyLLM实战--金庸小说阅读辅助器

本文介绍了基于LazyLLM框架开发的金庸小说阅读辅助器项目。LazyLLM是一个开箱即用的AI应用框架,相比LangChain更注重快速部署和简洁API。项目采用RAG(检索增强生成)技术,通过Document类处理多种文档格式,使用Embedding模型生成文本向量,并利用Retriever组件实现语义检索。以《神雕侠侣》为例,展示了如何构建一个"边读边问"的阅读辅助系统,可快速检索小说内容并

文章图片
#数据库
大模型笔记带实操记录

大模型训练的三个关键步骤:预训练(自监督学习,学习语言规律)、监督微调(SFT,将知识转化为人类可理解的回答)和优化阶段(RLHF/DPO,提升回答质量)。训练双模态模型时,需融合视觉与语言模型,通过图像嵌入转换和参数微调实现图文联合理解。代码展示了如何将视觉特征压缩后输入语言模型,保留原始空间关系。整个流程强调数据质量与高效参数更新的平衡。

文章图片
python数据分析基础笔记

numpy:支持大量的维度数组与矩阵运算arrayimport numpy as np#导入库并别名x = np.array([[1,2],[2,3]],int)#创建int型的数组#array([[1, 2],#[2, 3]])x.ndim#维度 2x.shape = (1,3)#几行几列 可改变 x.shape可查看x.dtype#元素类型x.itemsize#每个元素多少字节np.arang

#python#numpy#数据分析
    共 11 条
  • 1
  • 2
  • 请选择