Jack_abu 个人主页

@github_38727595

Jack_abu

2022-12-09 11:24:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型学习之——初步了解：量化、LoRA、QLoRA

量化是一种模型压缩技术，通过降低参数精度（如FP32→INT8）减小模型体积，而LoRA则是通过低秩适配器实现高效微调，仅训练少量新增参数。QLoRA结合二者优势，先对模型进行4-bit量化，再应用LoRA微调，使单卡GPU也能训练大模型。实战示例展示了如何使用LoRA微调代码生成模型，包括数据准备、模型配置、训练和推理全流程，并对比了不同场景下的超参数设置建议。三种技术形成了一套递进的模型瘦身+

#LoRA

RAG系统学习之——RAG技术详解与实战指南

本文全面介绍了RAG（检索增强生成）技术的背景、定义、优缺点及实战应用。RAG通过结合外部知识检索和大模型生成能力，有效解决了大语言模型的知识局限性和幻觉问题，成为企业知识管理的热门方案。文章详细阐述了RAG的技术架构、演进历程及适用场景，并提供了一个本地RAG系统的实战项目。RAG技术具有知识更新快、成本低、可解释性强等优势，但也面临检索质量依赖、文档处理复杂等挑战，特别适合企业知识库、专业咨询

#RAG

Comfyui简直就是低配置机器的福音，1080显卡上也能轻松玩转

本文对比了StableDiffusionWebUI和ComfyUI两种AI图像生成工具。StableDiffusionWebUI界面简洁易用，适合新手快速生成基础图像；而ComfyUI功能更强大，提供高级参数调整和实时预览，更适合专业用户深度定制。两者都基于扩散模型技术，通过逐步去噪生成高质量图像，但ComfyUI对硬件要求更低。文章还解释了扩散模型的工作原理和训练过程。建议初学者选择WebUI入

#人工智能

AIGC-Stable Diffusion Webui-AI作画初体验

Stable Diffustion, AIGC, AI智能画图，本地，Nvidia GeoForce 1080 8G*2

#AIGC #AI作画

JSON5是什么？它和JSON有什么区别？

什么是json5，它和json有什么区别，主要用在哪些场景？

#json #前端

在java项目中使用Ip2Region离线开源API实现IP归属地转换

使用开源项目IP2Region的API实现IP归属地查询，离线，效率高，准确率高。

#java #开源 #开发语言

Lombok介绍、使用、神奇操作、以及工作中遇到的一些坑

在没有lombok之前，我们写一个实体类(或JavaBean或Pojo或叫其他)，除了定义基本的属性之外，其他如无参构造方法、有参构造方法、setter/getter、toString、甚至equals、hashCode方法等，以及如果要操作Builder模式的话还需要自己手动编写大篇幅的代码去实现，枯燥，编码量大，还容易出现拼写错误。有了lombok之后，通过在类或属性上添加几个注解，就可以让编

#java

发现一个挺好的项目，可以在springboot项目中快速接入DeepSeek API，有需要的可以尝试一下

Spring AI接入DeepSeek AI，SpringBoot2.x版本接入DeepSeek4J，调用DeepSeek API尝鲜AIGC

#spring boot #java

DeepSeek学习笔记之——初识DeepSeek

DeepSeek是什么，DeepSeek-R1-Zero,DeepSeek-R1大模型，MoE（Mixture-of Experts）,RL(Reinforcement Learning)，KD（Knowledge Distillation）学习记录

鸿蒙心路旅程：从入门到放弃再到追赶~~~

我是一名java后端开发人员，主要负责推送业务相关的开发工作。——和鸿蒙基本没有交集 2024年4月份，偶然的一次机会，报名参加了“鸿蒙生态学堂-北京站”，开启了为期3天的鸿蒙学习之族。——初识经过3天时间的学习，对鸿蒙有了一个基本的了解，并且通过努力成功获得“HarmonyOS应用开发者高级认证”。阶段总结：新的开发语言：ArkTS——之前只是对js有简单的了解和使用经验，还局限在jQu

到底了