logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型本地化部署与微调实战指南:从入门到精通

文章探讨了大模型在垂直领域的应用挑战,包括幻觉和时效性问题,提出了检索增强生成(RAG)和微调(Fine-tuning)两种解决方案。详细介绍了微调的种类、工具框架及费用估算方法,以及实际操作流程。通过这些技术手段,可以增强大模型在特定领域的专业知识掌握能力,减少幻觉现象,提供更准确且最新的内容。

文章图片
#人工智能#算法#自然语言处理 +1
大语言模型完整技术栈:从理论到实践的全面指南

文章系统介绍了大模型微调技术的发展历程,从2018年全参数微调到2023年的偏好对齐技术,包括特征提取、Adapter、LoRA、提示微调、指令微调等方法。分析了各种微调技术的原理、特点和适用场景,解释了微调为何在大模型时代取代从零训练,并提供了根据实际业务需求选择合适微调方法的实用建议。

文章图片
#语言模型#人工智能#自然语言处理
万字长文综述大模型核心技术:微调、推理与优化指南

内容涵盖了**语言建模**、**预训练**面临的挑战、**量化技术**、**分布式训练方法**,以及大语言模型的**微调**。此外,还讨论了参数高效**微调(PEFT)技术**,包括**适配器**、**LoRA**和**QLoRA**;介绍了**提示策略**、模型压缩方法(如**剪枝和量化**),以及各种**量化技术**(**GPTQ、NF4、GGML**)。

文章图片
#人工智能#AI
一文搞清微调技术的发展与演进

现在的大语言模型发展得非常快,从几亿参数到千亿参数,不仅模型越来越大,能力也越来越强。但是在实际工作中,我们很少会从零开始训练一个这样的巨无霸模型,因为那样的成本和资源需求实在太高了。更多的时候,我们会先用一个现成的强大模型,然后根据自己的需求对它做一些“微调”,让它更懂我们的领域、更符合我们的业务和价值观。

文章图片
#人工智能#算法#AI
智能体(Agent)完全指南:从基础架构到主流框架深度解析

本文全面介绍了智能体(Agent)的核心概念与实现方法。文章阐述了智能体基础理论(PEAS模型、智能体循环、提示工程),对比了智能体与传统工作流的本质区别,详解了模型参数调优和三种主流架构(ReAct、Plan-and-Solve、Reflection),并分析了AutoGen、AgentScope、CAMEL和LangGraph等框架特点与适用场景,同时介绍了低代码开发平台和本地推理工具,为开发

文章图片
#人工智能#transformer
小白也能懂!知识图谱构建全流程与大模型应用指南

小白也能懂!知识图谱构建全流程与大模型应用指南

文章图片
#知识图谱#人工智能
AI Agent底层逻辑:思考-行动-观察循环揭秘,3个技巧让你掌握大模型新形态

文章介绍了AI Agent(智能体)的底层逻辑和工作原理。AI应用正从简单的聊天助手进化为全能助理,其核心是"思考→行动→观察"的循环过程。Agent由大模型(大脑)、工具(手脚)和基本循环(流程)组成。文章提供了三个实用技巧:帮助Agent思考、提供精确的背景信息、创新式使用工具。理解这些原理能帮助用户更好地驾驭AI工具,发挥其最大效能。

文章图片
#人工智能#AI
大模型高效微调:LoRA及其变种全解析

LoRA是一种高效的大模型微调方法,通过低秩分解在原始模型旁增加可学习矩阵,显著降低显存需求并保持与全参数微调相近的效果。文章详细介绍了LoRA原理及其多种变种,如QLoRA(4bit加载)、LoRA+(不同学习率)、AdaLoRA(动态调整秩)、DoRA(分解大小和方向)等。这些方法在保持模型性能的同时,进一步优化了训练效率和资源消耗,成为大模型参数高效微调(PEFT)的重要研究方向,在工程界得

文章图片
#大数据#人工智能#数据库 +1
一文彻底搞懂大模型参数高效微调(PEFT)

PEFT(Parameter-Efficient Fine-Tuning)是一种在保持预训练模型大部分参数不变的情况下,通过仅调整少量额外参数来适应新任务的技术。这些额外参数可以是新添加的嵌入层、低秩矩阵或其他类型的参数,它们被用来“引导”或“调整”预训练模型的输出,以使其更适合新任务。

文章图片
#人工智能#AI
Open Notebook:打造私有化AI助手,16种模型本地部署教程

本文介绍了Google的NotebookLM及其开源替代品Open Notebook。该工具支持16种AI模型,可在本地部署,保障数据隐私,支持多种格式导入,具备灵活权限控制和多角色语音功能。文章提供详细Docker部署方法,对比两个工具的优缺点,为追求数据安全和离线运行需求的用户提供了理想选择。

文章图片
#人工智能#自然语言处理#深度学习 +1
    共 126 条
  • 1
  • 2
  • 3
  • 13
  • 请选择