logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPTQ模型量化

GPTQ是一种高效的后训练量化算法,可将大模型权重压缩至低比特(如4-bit)而不显著降低性能。其核心思想是通过Hessian矩阵评估权重重要性,逐层最小化量化误差。实践步骤包括:1)创建专用环境并安装依赖;2)准备校准数据;3)执行量化流程,保存量化模型。测试显示量化后模型参数量显著减少(如Qwen2.5-7B从13.5GB降至4.2GB),推理速度提升约30%。该方法为大模型部署提供了高效的轻

文章图片
#人工智能#gpt-3#神经网络 +1
LLaMA-Factory使用

LLaMA-Factory是一个多功能大模型训练框架,支持LLaMA、Qwen等上百种模型的多种训练方式。本文演示了使用LLaMA-Factory微调Qwen2.5模型的过程,包括环境安装、数据准备和全量微调配置。关键步骤:1)安装指定版本LLaMA-Factory;2)准备JSON格式训练数据并注册;3)下载Qwen2.5模型;4)配置全量微调参数(含DeepSpeed优化)。该框架支持多种精度

文章图片
#人工智能#自然语言处理#语言模型 +2
LLaMa-Factory应用到实战(二)

本文系统介绍了开源大模型微调框架 LLaMA-Factory 的核心特性、技术优势与实战应用。相较于 Firefly、SWIFT、XTuner 等同类工具,LLaMA-Factory 提供了从数据预处理、高效微调(支持 LoRA/QLoRA/全参数训练)、自动评估到本地推理部署(含 Gradio 可视化界面)的端到端工具链,显著降低大模型定制化门槛。

文章图片
#自然语言处理#人工智能#目标检测 +3
LLaMa-Factory应用到实战(一)

本文系统介绍了开源大模型微调框架 LLaMA-Factory 的核心特性、技术优势与实战应用。相较于 Firefly、SWIFT、XTuner 等同类工具,LLaMA-Factory 提供了从数据预处理、高效微调(支持 LoRA/QLoRA/全参数训练)、自动评估到本地推理部署(含 Gradio 可视化界面)的端到端工具链,显著降低大模型定制化门槛。

文章图片
#人工智能#语言模型#深度学习 +3
不止是 Prompt:LangChain 如何让 AI 真正“行动”起来?

LangChain是一个围绕大语言模型(LLMs)构建的开发框架,旨在简化LLM应用的开发流程。它提供统一接口连接多种模型组件,包括LLMs、聊天模型和文本嵌入模型,并支持提示管理、记忆存储、索引构建等功能。LangChain的核心包包括基础抽象层、集成包和社区维护组件,通过模块化设计帮助开发者快速构建复杂的AI应用。文章详细介绍了如何使用不同模型进行文本生成和嵌入计算,并展示了提示模板的应用实例

文章图片
#人工智能#计算机视觉#神经网络 +1
Milvus向量数据库的使用

摘要: Milvus是一个开源的向量数据库,专为高效存储和检索AI模型生成的向量数据设计。它将非结构化数据(如文本、图像、音频)转换为高维向量,支持毫秒级相似性搜索。关键特性包括高性能、高可用性、混合查询和开发者友好性。核心概念包括非结构化数据、嵌入向量、向量相似度搜索以及Collection和Field的数据结构。Milvus支持多种索引类型(如FLAT、IVF_FLAT、HNSW)和相似度度量

文章图片
#milvus#数据库#人工智能 +4
RAG讲解及小demo实现

RAG(检索增强生成)技术通过结合大语言模型与外部知识源检索,有效解决了LLM的幻觉问题、知识滞后和领域专业性不足等局限性。其工作原理分为索引、检索、生成三阶段:将文档向量化存储,检索相关文本块后与查询共同构成提示词输入LLM生成回答。相比传统检索问答和纯LLM方案,RAG兼具可靠性(答案可溯源)、知识可更新性和自然语言表达能力。技术优势包括支持私有数据、实时更新、降低幻觉风险及增强数据安全。示例

文章图片
#自然语言处理#人工智能#目标检测 +4
私有化大模型部署_基于ollama+ChatBox实现chatBot(二)

Ollama提供完整的本地大模型管理方案,包含命令行工具和API接口。客户端支持run(运行模型)、show(查看信息)、pull(下载模型)、list/ls(列出模型)、ps(查看运行模型)、rm(删除模型)等命令,其中run命令支持指定模型版本、提示词及运行参数。API方面采用HTTP协议,支持GET/POST请求,提供模型生成、聊天、创建等接口,返回JSON格式数据。典型API包括生成接口(

文章图片
#人工智能#语言模型#python +2
私有化大模型部署_基于ollama+ChatBox实现chatBot(一)

私有大模型因数据隐私与安全问题成为企业AI应用的新方向,典型案例如三星员工使用ChatGPT导致机密泄露。Ollama和LMstudio等工具应运而生,支持本地化部署大模型。Ollama作为开源轻量级框架,提供一站式管理、热加载模型、多平台支持等特性,简化了LLM的本地运行与开发。安装方式涵盖Windows、Mac和Linux,Linux可通过手动或脚本安装。以通义千问(Qwen)为例,演示了模型

#python#人工智能#语言模型
到底了