logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型学习之——初步了解:量化、LoRA、QLoRA

量化是一种模型压缩技术,通过降低参数精度(如FP32→INT8)减小模型体积,而LoRA则是通过低秩适配器实现高效微调,仅训练少量新增参数。QLoRA结合二者优势,先对模型进行4-bit量化,再应用LoRA微调,使单卡GPU也能训练大模型。实战示例展示了如何使用LoRA微调代码生成模型,包括数据准备、模型配置、训练和推理全流程,并对比了不同场景下的超参数设置建议。三种技术形成了一套递进的模型瘦身+

#LoRA
RAG系统学习之——RAG技术详解与实战指南

本文全面介绍了RAG(检索增强生成)技术的背景、定义、优缺点及实战应用。RAG通过结合外部知识检索和大模型生成能力,有效解决了大语言模型的知识局限性和幻觉问题,成为企业知识管理的热门方案。文章详细阐述了RAG的技术架构、演进历程及适用场景,并提供了一个本地RAG系统的实战项目。RAG技术具有知识更新快、成本低、可解释性强等优势,但也面临检索质量依赖、文档处理复杂等挑战,特别适合企业知识库、专业咨询

#RAG
Comfyui简直就是低配置机器的福音,1080显卡上也能轻松玩转

本文对比了StableDiffusionWebUI和ComfyUI两种AI图像生成工具。StableDiffusionWebUI界面简洁易用,适合新手快速生成基础图像;而ComfyUI功能更强大,提供高级参数调整和实时预览,更适合专业用户深度定制。两者都基于扩散模型技术,通过逐步去噪生成高质量图像,但ComfyUI对硬件要求更低。文章还解释了扩散模型的工作原理和训练过程。建议初学者选择WebUI入

#人工智能
AIGC-Stable Diffusion Webui-AI作画初体验

Stable Diffustion, AIGC, AI智能画图,本地,Nvidia GeoForce 1080 8G*2

文章图片
#AIGC#AI作画
JSON5是什么?它和JSON有什么区别?

什么是json5,它和json有什么区别,主要用在哪些场景?

文章图片
#json#前端
在java项目中使用Ip2Region离线开源API实现IP归属地转换

使用开源项目IP2Region的API实现IP归属地查询,离线,效率高,准确率高。

文章图片
#java#开源#开发语言
Lombok介绍、使用、神奇操作、以及工作中遇到的一些坑

在没有lombok之前,我们写一个实体类(或JavaBean或Pojo或叫其他),除了定义基本的属性之外,其他如无参构造方法、有参构造方法、setter/getter、toString、甚至equals、hashCode方法等,以及如果要操作Builder模式的话还需要自己手动编写大篇幅的代码去实现,枯燥,编码量大,还容易出现拼写错误。有了lombok之后,通过在类或属性上添加几个注解,就可以让编

文章图片
#java
发现一个挺好的项目,可以在springboot项目中快速接入DeepSeek API,有需要的可以尝试一下

Spring AI接入DeepSeek AI,SpringBoot2.x版本接入DeepSeek4J,调用DeepSeek API尝鲜AIGC

文章图片
#spring boot#java
DeepSeek学习笔记之——初识DeepSeek

DeepSeek是什么,DeepSeek-R1-Zero,DeepSeek-R1大模型,MoE(Mixture-of Experts),RL(Reinforcement Learning),KD(Knowledge Distillation)学习记录

文章图片
鸿蒙心路旅程:从入门到放弃再到追赶~~~

我是一名java后端开发人员,主要负责推送业务相关的开发工作。——和鸿蒙基本没有交集 2024年4月份,偶然的一次机会,报名参加了“鸿蒙生态学堂-北京站”,开启了为期3天的鸿蒙学习之族。——初识 经过3天时间的学习,对鸿蒙有了一个基本的了解,并且通过努力成功获得“HarmonyOS应用开发者高级认证”。 阶段总结: 新的开发语言:ArkTS——之前只是对js有简单的了解和使用经验,还局限在jQu

到底了