
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
RAG(检索增强生成)技术解决了大模型的两大痛点:知识冻结和幻觉问题。它通过检索外部知识库获取相关信息,再提供给模型生成答案,显著提升回答准确性。RAG流程包括检索、增强和生成三个阶段,开发难点涉及文件解析、文档切割、知识检索和重排序等环节。该技术适用于专业问答系统、企业知识库等对准确性要求高的场景,但在实时对话等对延迟敏感的服务中可能不适用。RAG中模型参与三个阶段:文本向量化、结果重排序和答案

LangChain是一个开源框架,用于构建基于大语言模型(LLM)的应用程序。它将模型能力与外部数据、工具和业务流程连接起来,简化复杂AI应用的开发。主要功能包括prompt构建、LLM接入、记忆管理、工具调用、RAG和智能体开发等模块。相比直接调用模型API,LangChain提供了统一规范的调用方式,降低了学习成本和开发难度。其架构包含核心组件LangChain、第三方集成社区、LangGra

本文介绍了LangChain框架中三种主要的大语言模型类型及其应用场景。LLMs(非对话模型)适用于单次文本生成任务,Chat Models(对话模型)支持多轮对话交互,Embedding Models则用于文本向量化处理。文章通过代码示例展示了各模型的使用方式,并对比了OpenAI Chat、OpenAI Responses和阿里云DashScope三种接口的差异:OpenAI Chat适合简单

摘要 LangChain的Model I/O模块是与语言模型交互的核心组件,包含Prompt Template、Model和Output Parser三部分,分别对应输入、模型处理和输出。Prompt Template通过动态变量组合生成最终提示词,支持多种类型如ChatPromptTemplate(适用于聊天模型)、FewShotPromptTemplate(少样本提示)等。ChatPrompt

本文介绍了如何使用Ollama工具在本地部署大语言模型,并通过LangChain进行调用开发AI应用。主要内容包括:Ollama的特点(数据隐私可控、无需外网依赖等)、环境安装配置、基础调用方法、结合PromptTemplate的使用技巧,以及如何通过FastAPI构建简单对话接口。文章还提供了常见问题解决方案,如模型响应慢的处理方法和查看已安装模型的方式。该方案为开发者提供了本地运行大模型的完整

在基于大语言模型开发复杂AI应用时,单一的模型调用、提示词模板往往无法满足实际业务需求,而LangChain中的Chains(链) 正是为解决这一问题而生的核心能力。Chains通过将提示模板、LLM模型、输出解析器、记忆、工具等模块化组件串联/组合,形成可复用的AI工作流,让开发者能够轻松实现比单一组件更强大的功能。

LangChain的Memory组件解决了大模型在多轮对话中缺乏上下文记忆的问题。原生大模型每次交互都是独立请求,无法记住历史对话。Memory组件通过存储和管理对话历史,使模型能基于完整上下文生成回答。核心模块包括ChatMessageHistory(底层存储)和ConversationBufferMemory(完整对话记忆)。开发者可通过这些组件实现对话历史的自动保存与读取,构建具备上下文感知

本文介绍了LangChain的Tools组件,它是大语言模型(LLM)的外部能力扩展接口,使AI能够调用搜索引擎、计算器等外部功能,实现从文本生成到实际操作的跨越。Tools与Agent结合形成"思考+行动"能力,具有增强LLM功能、支持智能决策和模块化设计三大特点。文章详细解析了Tool的核心要素(名称、描述、参数规范等)和两种自定义方式:@tool装饰器(适合新手)和Str

在物流运输业务中,司机需要上传车头照片、货物装载照片、雨布覆盖照片等运输过程凭证。当前系统采用 Qwen 多模态模型对图片进行自动审核,但实际应用发现,部分司机上传的图片存在横屏拍摄或旋转 90°、180°、270° 等情况,导致模型对车辆和货物状态的识别准确率下降。通过业务验证发现,对图片进行方向矫正后,多模态模型的审核效果得到明显提升。因此,在图片审核流程前增加车辆图片旋转角度检测与自动矫正模

MCP,全称是 Model Context Protocol,可以理解为一种让大模型和外部工具进行标准化连接的协议。它的目标不是让每个 AI 应用都重新发明一套工具调用规范,而是提供一种统一的方式,让模型、Agent、工具服务之间能够按照约定通信。








