logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型RAG】一文搞定大模型知识库RAG:Milvus 2.5 + BM25 + BGE重排 +大模型

本文基于 Milvus 2.5 的混合检索能力,结合 BGE 向量化与 BM25 全文检索,配合 BGE Reranker 重排,最终调用 GPT-4.1-mini 生成高质量回答,搭建了一个端到端的 RAG 问答/推荐 Demo,适用于电商、企业知识库等场景。

文章图片
一文详解本地知识库RAG(检索增强):LangChain + Hugging Face 三件套 + 本地大模型 + MCP 协议 + Chroma + Agent 全流程实战

模型上下文协议(MCP)是 Anthropic 推出的开放标准,基于 JSON-RPC 2.0,为 AI 应用与外部工具/数据源之间提供统一的双向通信协议,被称为“AI 应用的 USB-C”。LangChain 是一个围绕 LLM、提示模板(Prompts)、记忆(Memory)、链(Chains)、工具(Tools)和代理(Agents)等组件打造的开源框架,旨在简化复杂自然语言应用的开发。:任

文章图片
#RAG#人工智能#深度学习
【大模型】Query 改写常见Prompt 模板

本文介绍了企业级Query改写技术的核心应用场景和常见Prompt模板,包含5种典型测试用例(拼写纠错、上下文补全、术语替换、多义词消歧、专业查询)来验证改写效果。提供了4种中英对照的Prompt模板:简洁零样本重写、前缀式调用、提示增强、结合RAG的生成式改写,并附有Python代码示例。重点展示了如何通过多样化并行改写和语义相似度排序来提升检索性能,适用于RAG应用和大模型问答系统,帮助开发者

【大模型安全】Prompt 注入与代码指令注入:Agent 与大模型安全

本文系统梳理了大模型(LLM)在企业应用中的四类常见安全风险:提示词注入、RAG 间接注入、代码/指令注入以及 Agent 过度代理,并结合真实事故案例解析攻击原理与绕过手法。文章不仅讲清“为什么会中招”,还给出可直接落地的修复方案,包括输入门禁(Unicode 归一化、同形字清洗)、RAG 去指令化、Agent 最小权限与沙箱执行、输出结构化校验、审计日志留痕、自动化红队回归等。同时提供 Pyt

文章图片
【大模型lora微调】关于推理时如何使用 LoRA Adapter

这样就可以直接用 LoRA 微调后的模型推理,无需合并!

【大模型RAG】识别-检索-生成:拍照搜题给出答案原理讲解

作业帮把一张题目照片“秒变”成标准答案与完整解析,靠的是 “多模态 OCR → 语义检索 → 答案渲染” 三段式流水线,而不是让大模型次次现场推理。下面整理了官方访谈、公开演讲、技术博客与大会 PPT 中能查到的关键信息,尽量还原其真实的工程落地路径。作业帮的拍照搜题能力是把题目图片拆解成结构化数据后,用海量题库“记忆”答案——真正调用大模型推理只发生在极少数冷门题。具体做法是:先用包含 30 余

文章图片
#深度学习
一文详解本地知识库RAG(检索增强):LangChain + Hugging Face 三件套 + 本地大模型 + MCP 协议 + Chroma + Agent 全流程实战

模型上下文协议(MCP)是 Anthropic 推出的开放标准,基于 JSON-RPC 2.0,为 AI 应用与外部工具/数据源之间提供统一的双向通信协议,被称为“AI 应用的 USB-C”。LangChain 是一个围绕 LLM、提示模板(Prompts)、记忆(Memory)、链(Chains)、工具(Tools)和代理(Agents)等组件打造的开源框架,旨在简化复杂自然语言应用的开发。:任

文章图片
#RAG#人工智能#深度学习
到底了