
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
知识点:自定义LLM/ChatModel、Model I/O、PromptTemplate、LCEL链式调用、Token统计、缓存功能封装通义千问/本地开源模型为 LangChain 标准模型实现对话、角色人设、调用缓存、记录Token消耗重点吃透「自定义LLM继承、_generate/_call、模型参数调优」。知识点:Pydantic结构化输出、自定义解析器、类NER信息抽取、Runnable

多向量检索:一个文档块 = 3 份向量原文向量摘要向量(LLM 总结这段话)HyDE 假设问题向量(LLM 猜用户会怎么问)检索时 3 路同时搜 → 命中率暴涨HyDE:假设文档嵌入,Hypothetical Document Embeddings用户问一个问题 → 先用 LLM 生成一段 “假设的答案文档” → 把这段假答案做 embedding → 用这个向量去库里搜最相似的真实文档。核心代码

内置知识库(不触发 invoke,低消耗)模型训练时录入的存量知识,本地直接推理作答适用:词语释义、常识典故、基础理论、历史固定内容、文本分析、常规问答联网搜索 / 外部工具(触发 invoke,额外耗资源)向外请求外部数据、实时内容、本地文件、运算服务适用:实时时间、最新资讯、动态数据、数学计算、文档查询、当下变动信息核心分界信息固定不变→用内置知识信息实时可变 / 外部独有→走调用检索工具单独

内置知识库(不触发 invoke,低消耗)模型训练时录入的存量知识,本地直接推理作答适用:词语释义、常识典故、基础理论、历史固定内容、文本分析、常规问答联网搜索 / 外部工具(触发 invoke,额外耗资源)向外请求外部数据、实时内容、本地文件、运算服务适用:实时时间、最新资讯、动态数据、数学计算、文档查询、当下变动信息核心分界信息固定不变→用内置知识信息实时可变 / 外部独有→走调用检索工具单独

多向量检索:一个文档块 = 3 份向量原文向量摘要向量(LLM 总结这段话)HyDE 假设问题向量(LLM 猜用户会怎么问)检索时 3 路同时搜 → 命中率暴涨HyDE:假设文档嵌入,Hypothetical Document Embeddings用户问一个问题 → 先用 LLM 生成一段 “假设的答案文档” → 把这段假答案做 embedding → 用这个向量去库里搜最相似的真实文档。核心代码

知识点:自定义LLM/ChatModel、Model I/O、PromptTemplate、LCEL链式调用、Token统计、缓存功能封装通义千问/本地开源模型为 LangChain 标准模型实现对话、角色人设、调用缓存、记录Token消耗重点吃透「自定义LLM继承、_generate/_call、模型参数调优」。知识点:Pydantic结构化输出、自定义解析器、类NER信息抽取、Runnable

上节课我们通过示例选择器,将案例直接嵌入到单一提示词中实现小样本学习。而当前主流大模型均支持多轮对话,能够依据历史聊天记录学习问答模式与回答风格。基于这一特性,我们可以将示例案例直接嵌入多轮对话历史中,让模型参考历史对话形式生成回复,这便是。本节课将重点学习如何在多轮对话中嵌入案例,同时结合相似案例检索能力,将匹配的示例加入历史对话作为参考,引导模型按照预设范式输出结果。整体仍基于小样本提示模板实

messages只存状态。优雅的“流式”核心是:增量更新Res模拟播放。交互一致:禁用/自动滚动/样式统一。可替换 backend:目前是模拟,后续无需再改前端结构。这套模式适合 chat、生成文案、关键进度可视化场景。

在LangChain生态中,无论是本地部署的模型(如Ollama、Xinference),还是线上第三方未被LangChain内置的模型(如小众厂商API、私有部署模型),都需要通过自定义封装,使其适配LangChain的标准调用方式,从而无缝使用LangChain的全部生态能力(如invoke、chain、agent等)。结合实操中的常见疑问,本节梳理自定义LLM封装的核心逻辑、实现要点及关键细

LangChain 是大模型应用开发的主流框架,专注于构建LLM workflows,是生成式 AI 时代的软件工程工具。面向开发者,生态丰富解决复杂工作流手撸效率低、难维护的问题标准结构:Input → Processing → Output相比 AutoGen 更贴近工程化支持 LangGraph 多智能体流程LangSmith 提供中间过程可视化,弥补调试盲区推荐学习资料:《大模型应用开发








