logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型基础部署】(学习笔记)

《大模型部署全流程指南:从压缩到应用开发》系统介绍了2026年主流的大模型部署技术。在模型压缩方面,重点探讨了量化、剪枝和知识蒸馏三大技术,其中量化可将显存占用减少4-8倍,AWQ等新方法能在INT4精度下实现无损压缩。部署工具部分对比了vLLM、Ollama和Triton等框架,特别介绍了vLLM的PagedAttention技术如何提升显存利用率。推理加速章节详细分析了MoE架构和连续批处理等

文章图片
#人工智能#机器学习#深度学习
[大模型LoRA微调]学习笔记

LLaMA-Factory 基本都收录了这些新方法,学会它之后改一行配置就能试用。微调 = 好基座 + 好数据 + QLoRA + 迭代评估不需要理解梯度下降、反向传播,也能做出有效的微调模型。

文章图片
#python#人工智能#机器学习
【大模型vLLM 使用】学习笔记

微调不是为了训练,是为了用。LLaMA-Factory 给你一个补丁,vLLM 把你的补丁变成服务。

文章图片
#学习
【AI技术应用工具详解】(学习笔记)

本文系统介绍了大模型应用的核心技术框架及企业级实现方案。主要内容包括: 核心技术理论: Prompt工程:结构化输入设计原则 CoT链式思考:分步推理机制 RAG检索增强:实时知识补充 Agent智能体:自主任务执行 MCP协议:标准化工具连接 企业采购助手实验: 通过五步流程演示技术协同: Prompt定义角色边界 Agent+CoT进行任务拆解 RAG查询采购政策 MCP调用ERP系统 闭环反

文章图片
#人工智能#学习
【LangChain 大模型6大调用指南】调用大模型篇

本文介绍了LangChain调用大模型的6种方式,分为同步和异步两类。同步调用包括普通调用(invoke)、流式调用(stream)和批量调用(batch);异步调用包含异步普通调用(ainvoke)、异步流式(astream)和异步批量(abatch)。文章详细说明了每种调用方式的特点、适用场景和代码示例,并比较了同步与异步调用的选择策略。此外,还介绍了三种核心消息类型(SystemMessag

文章图片
#linux#运维#服务器 +2
【LangChain 多轮对话】记忆篇

本文介绍了LangChain实现多轮对话的核心方法。主要内容包括:1)多轮对话与单轮对话的区别,前者能记住历史上下文;2)对话历史管理,包括手动添加消息和使用MessagesPlaceholder占位符;3)多种记忆机制:BufferMemory完整保存历史、TokenBufferMemory控制token消耗、SummaryMemory自动总结、VectorStoreMemory语义检索;4)实

文章图片
#人工智能#数据库
[LangChain Agent]Agent实战篇

本文详细介绍了LangChain框架中的Agent(智能体)技术,重点解析了其核心概念、ReAct推理模式、create_agent高级API使用方法,以及Agent-to-Agent(A2A)多智能体协作架构。文章通过三个实战案例(电商助手、天气查询助手和出行规划系统)展示了Agent的开发流程,对比了Agent与传统链式调用的优势,强调其动态决策、工具调用和循环推理能力。特别深入讲解了A2A架

文章图片
#人工智能#学习
【LangGraph 基础详解】学习笔记

LangGraph是LangChain生态中的有状态多代理应用构建库,其核心思想是将业务逻辑建模为有向图,由节点(Node)和边(Edge)组成,数据以状态(State)在节点间流转。主要特点包括: 四大核心要素: State:共享数据容器(TypedDict字典) Node:处理函数,接收并更新State Edge:定义节点执行顺序 Graph:组装节点和边形成应用 关键机制: Reducer:

文章图片
#数据库#人工智能#python
【LangChain 记忆系统】记忆篇

本文介绍了LangChain中的记忆系统实现方案,主要包括三种方法:基础方案使用InMemoryChatMessageHistory实现内存存储,简单但无持久化;进阶方案通过RunnableWithMessageHistory自动管理对话历史,支持多会话;持久化方案采用RedisChatMessageHistory实现跨会话记忆存储。这些方案解决了大语言模型无状态的问题,使对话系统能够记住上下文,

文章图片
#数据库#人工智能#服务器 +1
【LangChain 工具调用详解】工具篇

​@tool"""两个整数相加"""​# 调用工具​# 查看工具元信息print(f"{add_number.description=}") # add_number.description='两个整数相加'print(f"{add_number.args=}")# 参数字段定义更清晰的参数描述更好的类型验证支持默认值、默认值校验等高级功能"""..."""pass工具调用要点概念说明@tool

文章图片
#数据库#人工智能#服务器
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择