logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

手把手系列 | 使用Milvus、Llama 3、Ollama、LangChain本地设置RAG应用

随着 Llama、Mistral、Gemma 等开源大语言模型(LLM)的出现,我们越来越能感受到 LLM 的力量,而本地运行基于 LLM 的 RAG 应用的需求越来越强烈。在将应用推至生产环境前,我们往往都需要先本地运行和测试。因此,本文将介绍如何使用 Ollama、Llama 3 和 Milvus 向量数据库在本地部署一个检索增强生成(RAG)应用。本文将使用到的软件和工具包括:LangCha

#milvus
使用 Ollama、Llama 3.1 和 Milvus 实现Function Calling 功能

将函数调用(Function Calling)与 LLM 相结合能够扩展您的 AI 应用的能力。通过将您的大语言模型(LLM)与用户定义的 Function 或 API 集成,您可以搭建高效的应用,解决实际问题。本文将介绍如何将 Llama 3.1 与 Milvus 和 API 等外部工具集成,构建具备上下文感知能力的应用。01Function Calling 简介诸如 GPT-4、Mistral

#milvus
使用 Milvus、vLLM 和 Llama 3.1 搭建 RAG 应用

vLLM 是一个简单易用的 LLM 推理服务库。加州大学伯克利分校于 2024 年 7 月将 vLLM 作为孵化项目正式捐赠给 LF AI & Data Foundation 基金会。欢迎 vLLM 加入 LF AI & Data 大家庭!????在主流的 AI 应用架构中,大语言模型(LLM)通常与向量数据库配套使用,用于构建检索增强生成(RAG)应用,从而解决 AI 幻觉问题。

#milvus
Qwen3.5-397B+Milvus+ColQwen2,如何做基于PDF的多模态RAG知识库

对于查询的每个 token 向量,找到文档中最匹配的 patch(最大内积),然后将所有 token 的最大匹配分数求和,作为该文档的总分。这套架构唯一的小代价,是ColQwen2约4.4GB的模型体积,以及图片编码比文本编码稍高的推理耗时,但对比它带来的检索精度与兼容性提升,在绝大多数实际场景中,都是完全可以接受的。是的,相比相比上一代Qwen3-Max的万亿参数,尺寸变小了,但性能基本持平甚至

#milvus
2026 年,Embedding要怎么选?(实测Gemini 、jina、Qwen、BGE、OpenAI十大模型)

—清楚自己的业务场景和数据长什么样,用自己的数据搭一套能快速验证新模型的测试流程,新东西出来的时候跑一轮就知道行不行。另一边,335M 以下的模型在 4K 字符(大概 1000 tokens)就掉到了 0.46-0.60——如果你的 RAG 系统文档平均超过 2000 字,用这些模型需要留意。如果不需要维度压缩,这个项目的参考价值有限。,覆盖 API 服务和开源本地部署两种形态,也加上了 Open

#jina
Skills 比MCP好在哪儿?如何用Milvus-Skills 搭建知识库

本文介绍了Anthropic推出的Skills工具调用标准,相比传统MCP方法具有更精简的上下文、更高标准化和更强可控性。文章详细讲解了Skills的目录结构(SKILL.md核心文件、scripts执行脚本、templates文档模板和resources参考资料),并以创建Milvus Skills为例,演示了如何通过自然语言描述自动构建RAG系统或Milvus Collection。实战部分包

文章图片
#milvus
微博、EXA、亚马逊云科技是怎么用好向量检索的,看这一篇就够了|活动回顾

他开篇明确指出,当下AI Agent要实现真正的实用化,可靠的记忆系统是不可或缺的核心前提,传统仅依赖大模型上下文窗口的模式存在天然局限——即便窗口持续扩容,也如同内存再大仍需磁盘存储,而向量数据库正是AI Agent的“外置大脑”,承载着长期记忆的存储、检索与更新核心需求。随着非结构化数据的爆发与AI技术的快速迭代,向量数据库作为核心支撑技术,正与AI Agent、AI搜索、对话助手等各类场景深

#科技
Claude通过Cowork实现模型主动记忆,要如何复现?我们还需要RAG吗?

指的是短期、非持久化记忆,仅在会话启动时注入一次,会话结束后销毁,主要用于让模型适配当前场景(如移动端简化回复格式),不影响长期记忆。,是长期、可编辑的核心记忆,用于记录用户稳定属性(,如姓名、职业目标、过往经历、项目成果、学习偏好),每次对话都会强制注入。具体来说,模型会选择性的记住我们每次与它交互的过程,以及产生的结论,这些数据可以被实时写入、快速检索、并且以短期记忆、用户属性、长期记忆等形式

企业级RAG教程 | langchain+AWS Bedrock+Zilliz,适合80%企业

本文介绍了基于AWS云平台构建企业级RAG(检索增强生成)系统的实践方案。针对传统大模型在企业应用中的知识时效性差、幻觉率高等问题,提出采用MVC架构设计,整合AWS Bedrock、Nova模型、Titan Embeddings和Zilliz Cloud等组件。文章详细阐述了系统架构设计思路、技术选型依据(包括AWS Lambda、Bedrock多模型支持、Zilliz向量数据库优势等),并提供

文章图片
#aws#云计算
不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解

摘要: Claude Code针对企业级本地AI编程场景的存储痛点,提出了一套系统化解决方案。通过多项目物理隔离(路径编码+独立存储)、实时持久化(JSONL流式写入)、完整消息链追溯(uuid+parentUuid)和操作可撤销(文件历史快照)四大机制,解决了传统方案在数据隔离、崩溃恢复、上下文追溯和操作回滚等方面的问题。采用三级配置体系(全局/本地/项目)实现灵活管理,配合插件扩展架构,在保障

文章图片
#microsoft
    共 137 条
  • 1
  • 2
  • 3
  • 14
  • 请选择