m0_71444338 个人主页

@m0_71444338

m0_71444338

2024-05-23 22:15:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

GPTQ模型量化

GPTQ是一种高效的后训练量化算法，可将大模型权重压缩至低比特（如4-bit）而不显著降低性能。其核心思想是通过Hessian矩阵评估权重重要性，逐层最小化量化误差。实践步骤包括：1）创建专用环境并安装依赖；2）准备校准数据；3）执行量化流程，保存量化模型。测试显示量化后模型参数量显著减少（如Qwen2.5-7B从13.5GB降至4.2GB），推理速度提升约30%。该方法为大模型部署提供了高效的轻

#人工智能 #gpt-3 #神经网络 +1

LLaMA-Factory使用

LLaMA-Factory是一个多功能大模型训练框架，支持LLaMA、Qwen等上百种模型的多种训练方式。本文演示了使用LLaMA-Factory微调Qwen2.5模型的过程，包括环境安装、数据准备和全量微调配置。关键步骤：1）安装指定版本LLaMA-Factory；2）准备JSON格式训练数据并注册；3）下载Qwen2.5模型；4）配置全量微调参数（含DeepSpeed优化）。该框架支持多种精度

#人工智能 #自然语言处理 #语言模型 +2

LLaMa-Factory应用到实战(二)

本文系统介绍了开源大模型微调框架 LLaMA-Factory 的核心特性、技术优势与实战应用。相较于 Firefly、SWIFT、XTuner 等同类工具，LLaMA-Factory 提供了从数据预处理、高效微调（支持 LoRA/QLoRA/全参数训练）、自动评估到本地推理部署（含 Gradio 可视化界面）的端到端工具链，显著降低大模型定制化门槛。

#自然语言处理 #人工智能 #目标检测 +3

LLaMa-Factory应用到实战(一)

#人工智能 #语言模型 #深度学习 +3

不止是 Prompt：LangChain 如何让 AI 真正“行动”起来？

LangChain是一个围绕大语言模型(LLMs)构建的开发框架，旨在简化LLM应用的开发流程。它提供统一接口连接多种模型组件，包括LLMs、聊天模型和文本嵌入模型，并支持提示管理、记忆存储、索引构建等功能。LangChain的核心包包括基础抽象层、集成包和社区维护组件，通过模块化设计帮助开发者快速构建复杂的AI应用。文章详细介绍了如何使用不同模型进行文本生成和嵌入计算，并展示了提示模板的应用实例

#人工智能 #计算机视觉 #神经网络 +1

Milvus向量数据库的使用

摘要： Milvus是一个开源的向量数据库，专为高效存储和检索AI模型生成的向量数据设计。它将非结构化数据（如文本、图像、音频）转换为高维向量，支持毫秒级相似性搜索。关键特性包括高性能、高可用性、混合查询和开发者友好性。核心概念包括非结构化数据、嵌入向量、向量相似度搜索以及Collection和Field的数据结构。Milvus支持多种索引类型（如FLAT、IVF_FLAT、HNSW）和相似度度量

#milvus #数据库 #人工智能 +4

RAG讲解及小demo实现

RAG（检索增强生成）技术通过结合大语言模型与外部知识源检索，有效解决了LLM的幻觉问题、知识滞后和领域专业性不足等局限性。其工作原理分为索引、检索、生成三阶段：将文档向量化存储，检索相关文本块后与查询共同构成提示词输入LLM生成回答。相比传统检索问答和纯LLM方案，RAG兼具可靠性（答案可溯源）、知识可更新性和自然语言表达能力。技术优势包括支持私有数据、实时更新、降低幻觉风险及增强数据安全。示例

#自然语言处理 #人工智能 #目标检测 +4

私有化大模型部署_基于ollama+ChatBox实现chatBot（二）

Ollama提供完整的本地大模型管理方案，包含命令行工具和API接口。客户端支持run（运行模型）、show（查看信息）、pull（下载模型）、list/ls（列出模型）、ps（查看运行模型）、rm（删除模型）等命令，其中run命令支持指定模型版本、提示词及运行参数。API方面采用HTTP协议，支持GET/POST请求，提供模型生成、聊天、创建等接口，返回JSON格式数据。典型API包括生成接口（

#人工智能 #语言模型 #python +2

私有化大模型部署_基于ollama+ChatBox实现chatBot(一)

私有大模型因数据隐私与安全问题成为企业AI应用的新方向，典型案例如三星员工使用ChatGPT导致机密泄露。Ollama和LMstudio等工具应运而生，支持本地化部署大模型。Ollama作为开源轻量级框架，提供一站式管理、热加载模型、多平台支持等特性，简化了LLM的本地运行与开发。安装方式涵盖Windows、Mac和Linux，Linux可通过手动或脚本安装。以通义千问（Qwen）为例，演示了模型

#python #人工智能 #语言模型

到底了