2201_75633021 个人主页

@2201_75633021

2201_75633021

2023-11-15 10:58:18 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型基础部署】（学习笔记）

《大模型部署全流程指南：从压缩到应用开发》系统介绍了2026年主流的大模型部署技术。在模型压缩方面，重点探讨了量化、剪枝和知识蒸馏三大技术，其中量化可将显存占用减少4-8倍，AWQ等新方法能在INT4精度下实现无损压缩。部署工具部分对比了vLLM、Ollama和Triton等框架，特别介绍了vLLM的PagedAttention技术如何提升显存利用率。推理加速章节详细分析了MoE架构和连续批处理等

#人工智能 #机器学习 #深度学习

[大模型LoRA微调]学习笔记

LLaMA-Factory 基本都收录了这些新方法，学会它之后改一行配置就能试用。微调 = 好基座 + 好数据 + QLoRA + 迭代评估不需要理解梯度下降、反向传播，也能做出有效的微调模型。

#python #人工智能 #机器学习

【大模型vLLM 使用】学习笔记

微调不是为了训练，是为了用。LLaMA-Factory 给你一个补丁，vLLM 把你的补丁变成服务。

#学习

【AI技术应用工具详解】（学习笔记）

本文系统介绍了大模型应用的核心技术框架及企业级实现方案。主要内容包括：核心技术理论： Prompt工程：结构化输入设计原则 CoT链式思考：分步推理机制 RAG检索增强：实时知识补充 Agent智能体：自主任务执行 MCP协议：标准化工具连接企业采购助手实验：通过五步流程演示技术协同： Prompt定义角色边界 Agent+CoT进行任务拆解 RAG查询采购政策 MCP调用ERP系统闭环反

#人工智能 #学习

【LangChain 大模型6大调用指南】调用大模型篇

本文介绍了LangChain调用大模型的6种方式，分为同步和异步两类。同步调用包括普通调用(invoke)、流式调用(stream)和批量调用(batch)；异步调用包含异步普通调用(ainvoke)、异步流式(astream)和异步批量(abatch)。文章详细说明了每种调用方式的特点、适用场景和代码示例，并比较了同步与异步调用的选择策略。此外，还介绍了三种核心消息类型(SystemMessag

#linux #运维 #服务器 +2

【LangChain 多轮对话】记忆篇

本文介绍了LangChain实现多轮对话的核心方法。主要内容包括：1)多轮对话与单轮对话的区别，前者能记住历史上下文；2)对话历史管理，包括手动添加消息和使用MessagesPlaceholder占位符；3)多种记忆机制：BufferMemory完整保存历史、TokenBufferMemory控制token消耗、SummaryMemory自动总结、VectorStoreMemory语义检索；4)实

#人工智能 #数据库

[LangChain Agent]Agent实战篇

本文详细介绍了LangChain框架中的Agent（智能体）技术，重点解析了其核心概念、ReAct推理模式、create_agent高级API使用方法，以及Agent-to-Agent（A2A）多智能体协作架构。文章通过三个实战案例（电商助手、天气查询助手和出行规划系统）展示了Agent的开发流程，对比了Agent与传统链式调用的优势，强调其动态决策、工具调用和循环推理能力。特别深入讲解了A2A架

#人工智能 #学习

【LangGraph 基础详解】学习笔记

LangGraph是LangChain生态中的有状态多代理应用构建库，其核心思想是将业务逻辑建模为有向图，由节点(Node)和边(Edge)组成，数据以状态(State)在节点间流转。主要特点包括：四大核心要素： State：共享数据容器(TypedDict字典) Node：处理函数，接收并更新State Edge：定义节点执行顺序 Graph：组装节点和边形成应用关键机制： Reducer：

#数据库 #人工智能 #python

【LangChain 记忆系统】记忆篇

本文介绍了LangChain中的记忆系统实现方案，主要包括三种方法：基础方案使用InMemoryChatMessageHistory实现内存存储，简单但无持久化；进阶方案通过RunnableWithMessageHistory自动管理对话历史，支持多会话；持久化方案采用RedisChatMessageHistory实现跨会话记忆存储。这些方案解决了大语言模型无状态的问题，使对话系统能够记住上下文，

#数据库 #人工智能 #服务器 +1

【LangChain 工具调用详解】工具篇

@tool"""两个整数相加"""# 调用工具# 查看工具元信息print(f"{add_number.description=}") # add_number.description='两个整数相加'print(f"{add_number.args=}")# 参数字段定义更清晰的参数描述更好的类型验证支持默认值、默认值校验等高级功能"""..."""pass工具调用要点概念说明@tool

#数据库 #人工智能 #服务器

共 73 条

请选择