
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了大语言模型的两种微调方法:全参数微调和参数高效微调(PEFT)。全参数微调更新所有参数但资源消耗大,而PEFT方法如LoRA和QLoRA通过低秩分解和量化技术显著降低计算成本。重点阐述了LoRA的原理,通过分解增量矩阵为低秩乘积,仅训练少量参数;QLoRA进一步引入4-bit量化和分页优化器,使微调可在消费级GPU上运行。最后介绍了LLaMA-Factory工具的使用方法,包括安装依赖和

本文介绍了大语言模型的两种微调方法:全参数微调和参数高效微调(PEFT)。全参数微调更新所有参数但资源消耗大,而PEFT方法如LoRA和QLoRA通过低秩分解和量化技术显著降低计算成本。重点阐述了LoRA的原理,通过分解增量矩阵为低秩乘积,仅训练少量参数;QLoRA进一步引入4-bit量化和分页优化器,使微调可在消费级GPU上运行。最后介绍了LLaMA-Factory工具的使用方法,包括安装依赖和

RAGFlow 核心实战摘要 RAGFlow 是字节跳动的开源 RAG 框架,提供文档解析、知识库管理、语义检索和聊天助手等功能。本地部署需配置环境变量(API_URL 和 API_KEY)并安装依赖包。核心功能包括: 知识库管理:通过 create_dataset 创建知识库,获取唯一 ID 用于后续操作 文档上传:支持批量上传 PDF/Word 等格式文件到指定知识库,自动解析切分 检索增强:
LangGraph是一个用于构建和管理长期运行有状态智能体的低级框架,其核心设计基于图计算模型。该框架通过节点(计算单元)、边(转换逻辑)和共享状态数据来构建智能体工作流,具有持久化执行、人机协作、记忆管理等生产级特性。与LangChain相比,LangGraph提供更细粒度的状态控制和并行执行能力,采用基于Google Pregel算法的三阶段执行模型(规划-执行-更新)。架构上包含Actors

LangChain是一个开源框架,用于开发基于大语言模型(LLM)的应用程序。它提供了一套完整的工具集,包括prompt构建、LLM接入、记忆管理、工具调用、RAG和Agent开发等功能模块。框架的核心Model I/O组件包含输入提示(Prompt Template)、模型调用(Model)和输出解析(Output Parser)三部分。LangChain支持通过OpenAI SDK或自身API








