logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型学习之——初步了解:量化、LoRA、QLoRA

量化是一种模型压缩技术,通过降低参数精度(如FP32→INT8)减小模型体积,而LoRA则是通过低秩适配器实现高效微调,仅训练少量新增参数。QLoRA结合二者优势,先对模型进行4-bit量化,再应用LoRA微调,使单卡GPU也能训练大模型。实战示例展示了如何使用LoRA微调代码生成模型,包括数据准备、模型配置、训练和推理全流程,并对比了不同场景下的超参数设置建议。三种技术形成了一套递进的模型瘦身+

#LoRA
大模型学习之——初步了解:量化、LoRA、QLoRA

量化是一种模型压缩技术,通过降低参数精度(如FP32→INT8)减小模型体积,而LoRA则是通过低秩适配器实现高效微调,仅训练少量新增参数。QLoRA结合二者优势,先对模型进行4-bit量化,再应用LoRA微调,使单卡GPU也能训练大模型。实战示例展示了如何使用LoRA微调代码生成模型,包括数据准备、模型配置、训练和推理全流程,并对比了不同场景下的超参数设置建议。三种技术形成了一套递进的模型瘦身+

#LoRA
java中使用雪花算法(Snowflake)为分布式系统生成全局唯一ID

使用雪花算法(Snowflake)为分布式系统中生成全局唯一ID,使用java语言实现

文章图片
#java#开发语言
RAG系统学习之——RAG技术详解与实战指南

本文全面介绍了RAG(检索增强生成)技术的背景、定义、优缺点及实战应用。RAG通过结合外部知识检索和大模型生成能力,有效解决了大语言模型的知识局限性和幻觉问题,成为企业知识管理的热门方案。文章详细阐述了RAG的技术架构、演进历程及适用场景,并提供了一个本地RAG系统的实战项目。RAG技术具有知识更新快、成本低、可解释性强等优势,但也面临检索质量依赖、文档处理复杂等挑战,特别适合企业知识库、专业咨询

#RAG
RAG系统学习之——RAG技术详解与实战指南

本文全面介绍了RAG(检索增强生成)技术的背景、定义、优缺点及实战应用。RAG通过结合外部知识检索和大模型生成能力,有效解决了大语言模型的知识局限性和幻觉问题,成为企业知识管理的热门方案。文章详细阐述了RAG的技术架构、演进历程及适用场景,并提供了一个本地RAG系统的实战项目。RAG技术具有知识更新快、成本低、可解释性强等优势,但也面临检索质量依赖、文档处理复杂等挑战,特别适合企业知识库、专业咨询

#RAG
java中使用雪花算法(Snowflake)为分布式系统生成全局唯一ID

使用雪花算法(Snowflake)为分布式系统中生成全局唯一ID,使用java语言实现

文章图片
#java#开发语言
设计模式学习之——代理模式

设计模式学习,代理模式,代理模式与装饰者模式的区别与联系,代理模式在spring框架中的应用等

文章图片
#设计模式#代理模式
Comfyui简直就是低配置机器的福音,1080显卡上也能轻松玩转

本文对比了StableDiffusionWebUI和ComfyUI两种AI图像生成工具。StableDiffusionWebUI界面简洁易用,适合新手快速生成基础图像;而ComfyUI功能更强大,提供高级参数调整和实时预览,更适合专业用户深度定制。两者都基于扩散模型技术,通过逐步去噪生成高质量图像,但ComfyUI对硬件要求更低。文章还解释了扩散模型的工作原理和训练过程。建议初学者选择WebUI入

#人工智能
Springboot项目集成Mybatis-Plus,多数据源配置,写主读从

springboot项目集成mybatis-plus,mybatis-plus多数据源,读写分离,写主读从,mybatis-plus中执行自定义sql

文章图片
#spring boot#mybatis
JDK8:用java.nio.file.Files.lines方法读取大型文件

使用jdk8中java.nio.file.Files.lines方法读取大型文件内容

文章图片
#java#nio#开发语言
    共 17 条
  • 1
  • 2
  • 请选择