logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM基础知识(一)

本文系统梳理了AI与大语言模型(LLM)相关核心概念,包括LLM、GPT、LLaMA等模型的定义与特点,以及Ollama推理引擎、RAG检索增强生成技术和Agent智能体的工作原理。文章还介绍了Dify、Coze等主流LLM开发框架的优缺点,为理解大语言模型技术体系提供了清晰的脉络。内容涵盖模型架构、推理部署、应用开发等关键环节,适合作为AI领域的技术参考指南。

文章图片
#python#开发语言
模型量化技术

本文系统梳理了模型量化技术,包括基本概念、精度类型、量化过程分类及主流方法。主要内容涵盖: 模型量化基础:通过降低数值精度(如FP32→INT8/INT4)减少模型大小和计算资源需求,同时控制精度损失。 量化方法对比: 训练时量化(QAT)如QLoRA 训练后量化(PTQ)如GPTQ/AutoGPTQ 不同位宽(16/8/4-bit)对显存和精度的影响 关键技术详解: GPTQ:面向Transfo

文章图片
#人工智能#python#算法 +2
llama-cpp-python 本地部署入门

本文介绍了llama-cpp-python库及其相关技术,主要内容包括: 核心概念:LLaMA是Meta开发的大型语言模型,GGML/GGUF是专为高效运行LLaMA设计的模型格式,其中GGUF是GGML的升级版,支持更多元数据并优化了tokenizer。量化技术可大幅减小模型体积(如70B模型从120GB压缩至38.5GB)。 本地部署:通过llama-cpp-python(LLaMA.cpp的

文章图片
#python#算法#开发语言
GPT4All 本地大语言模型运行环境介绍

摘要: GPT4All是一个开源本地大语言模型运行环境,支持在消费级电脑上离线运行多种GGUF格式模型,强调隐私、开放与易用性。其架构包含C++核心后端(基于llama.cpp)、跨平台桌面客户端(Qt/QML)、多语言绑定(如Python)及模型元数据管理。通过量化技术优化CPU性能,用户可通过GUI或代码(如gpt4all库)直接调用模型,实现本地化对话生成。示例代码展示了模型加载与交互流程,

文章图片
#python
LangChain工具调用Agent与MCP

本文介绍了LangChain工具调用Agent的相关内容,包括Agent的工作流程、创建和运行方法。文章首先对比了工具(Tool)与代理(Agent)的区别,指出Agent能协调多个工具并自主决策。然后详细讲解了创建工具的两种方式:使用Tavily搜索引擎创建搜索工具,以及通过文档加载、文本分割和向量数据库构建检索器工具。最后说明了如何将检索器封装为可被Agent调用的工具。全文为开发者提供了在L

文章图片
#python#开发语言
Gemini CLI 与 Repomix

本文整理了 Gemini CLI 与 Repomix 的基础使用方法。Gemini CLI 适合在终端中直接调用 Gemini 模型进行问答、编程辅助和文件编辑;Repomix 适合将代码仓库整理成大模型可阅读的单文件上下文,方便与 Claude、ChatGPT、DeepSeek、Gemini 等模型配合使用。实际使用时,需要注意代理、Google 账号授权、API/项目环境变量配置,以及根据模型

文章图片
#人工智能#开发语言#python
LangChain介绍与核心包

本文介绍了LangChain框架的核心概念与组件。LangChain是一个用于构建大语言模型(LLM)应用的开发框架,主要特性包括:LLM和提示管理、任务链(Chain)编排、LCEL表达式语言、RAG数据增强生成、Agents智能体等。框架由多个包组成,包括基础抽象层(langchain-core)、第三方集成(langchain-community)和核心功能(langchain)。文章详细说

文章图片
#开发语言#python
LangChain 提示词工程

本文详细介绍了LangChain中的提示词工程(Prompt Engineering),包括PromptTemplate和ChatPromptTemplate的使用方法。主要内容涵盖:1) 提示词模板的基本概念与组成,包含指令、示例和问题三部分;2) 新旧版本导入方式的区别;3) 如何创建和格式化提示词模板,包括部分参数填充;4) 聊天消息提示词模板的特殊性,区分system、human、ai等不

文章图片
#开发语言#python
LangChain工作流

本文介绍了LangChain工作流的核心内容,包括模型类型与输入输出、LCEL表达式语言及其优势。主要内容涵盖:1) LangChain封装的两类模型(大语言模型LLM和聊天模型Chat Models)的输入输出差异;2) LCEL表达式语言的特性,如流式处理、异步支持、并行执行和重试机制;3) 通过代码示例展示了LLM和Chat Models的实际应用场景。文章为开发者提供了LangChain工

文章图片
#开发语言#python
LangChain服务部署与链路监控

本文介绍了LangChain服务部署与链路监控相关内容,主要包括LangServe服务部署、LangChain CLI工具使用以及链路监控方法。LangServe可将LangChain链部署为REST API,基于FastAPI和Pydantic构建,提供自动模式推断、API文档和高效接口。文章详细说明了安装步骤、项目创建流程、常见报错解决方案及关键依赖版本要求,并介绍了使用LangSmith进行

文章图片
#开发语言#python
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择