登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了AgentX技术专栏中的双层记忆架构设计,通过Redis实现短期记忆存储和Milvus实现长期记忆存储,解决LLM无状态问题。Redis存储最近20轮对话,24小时TTL自动过期,保证多实例一致性;Milvus存储语义化知识片段,支持RAG检索。文章详细解析了RedisMemoryStore的实现、Fallback机制保障高可用,以及如何与LangChain4j集成。同时总结了序列化、m
很多人对 RAG 的第一印象,仍然停留在一张非常简洁的架构图里:前端负责提问,后端负责调度,向量库负责检索,大模型负责回答。这张图当然没有错。它适合解释 RAG 的基本原理,也足够让人快速理解“检索增强生成”这件事。但问题在于,一旦系统从 Demo 走向真实业务,这张图就开始不够用了。
Nano Banana 2:完成度直接拉满,加了窗框做前景有纵深感,东方明珠细节清、黄浦江有船只,光影层次分明,雨滴和水渍的质感几乎和实拍没差,4:1 超宽比例也没透视畸变,电商图绕不开文字,价签、营销标语、跨境多语言文案,这些都是是过去 AI 生图的通病,Nano Banana 2 的优势在于,能生成无错漏的易读文本,还支持多语言翻译和本地化。整体效果可以看到,初代 Nano Banana比较中
Milvus是一款高性能开源向量数据库,专为相似性搜索设计,支持十亿级向量的毫秒级检索。其2.x版本采用分布式架构,包含接入层、协调服务层、工作节点层和存储层,支持多语言SDK和多种索引类型。Milvus 2.3-2.4版本新增GPU加速、稀疏向量支持、混合检索等特性。数据模型包含Collection、Partition、Field等核心概念,支持多种向量和标量数据类型。学习路线分为基础概念、性能
本文介绍了Milvus向量数据库的核心概念、性能特点和部署方式。Milvus是一款开源的高性能向量数据库,支持多种向量索引类型和搜索功能,具备云原生架构和分布式扩展能力。文章详细阐述了Milvus的关键特性,包括非结构化数据处理、多模态搜索、大模型赋能等,并对比了其与内存数据库的性能差异。最后提供了Milvus的三种部署方案,重点说明了Docker安装Standalone版本的具体步骤。Milvu
探讨了构建实用Agent记忆系统关键作用。文章提出三层记忆架构:工作记忆(处理当前任务)、情景记忆(记录历史事件)和语义记忆(存储长期知识),并分析了HER机制如何从失败中学习。通过医疗问答,展示不同记忆层协同工作:工作记忆保持上下文连贯,情景记忆召回相似对话,语义记忆提供专业知识,HER则优化后续响应策略。还给出工程实现建议,包括Redis存工作记忆、MySQL+Milvus管理情景记忆、知识图
RAG 进阶:用 Milvus + bge-m3 构建语义企业知识库 本文介绍了如何利用 Milvus 向量数据库和 bge-m3 嵌入模型构建比传统 ES 更懂语义的企业知识库系统。文章首先分析了 ES 关键词检索在口语化查询场景下的结构性缺陷,指出向量检索通过语义相似度匹配能有效解决"用户提问与文档术语不匹配"的问题。重点讲解了 bge-m3 模型的特点(支持稠密、稀疏和多向量三种检索模式)和
你是不是也觉得"调好 Prompt 就万事大吉"了?说实话,小编当初也这么想。但随着项目越做越复杂,我才发现——Prompt 只是起点,后面还有两层更硬核的工程等着你。本文带你一口气吃透 AI 工程的三次进化:Prompt Engineering → Context Engineering → Harness Engineering。零基础友好,万字长文,建议收藏慢慢看。
本文系统介绍了开源分布式向量数据库Milvus的核心架构与索引选型。Milvus采用分层解耦设计,包含Proxy接入层、Coordinator协调层、Workers执行层和DurableStorage存储层,支持弹性扩展。重点解析了FLAT、IVF_FLAT、IVF_SQ8、HNSW、SCANN和DISKANN六种索引类型的特点及适用场景,并对比了L2、IP和COSINE三种相似度量方式。作为RA
本文记录了我独立开发"水质三维智能监测与分析系统"过程中,在 AI 工程化方向积累的三个核心实战经验。文章涉及自研 Agent 工具调用框架的架构设计与流式难题、RAG 四层检索的参数调优与效果对比、以及 Milvus 向量数据库从连接超时到数据一致性的全线防御策略。项目完整源码已开源在 GitHub。
本文解析了Milvus中稠密向量与稀疏向量的核心概念与应用。稠密向量擅长语义理解,表现为固定长度的高维浮点数组;稀疏向量则专注于精准字面匹配,采用权重矩阵结构。文章详细阐述了L2、COSINE和IP三种距离度量方式的适用场景,以及归一化带来的性能优化。特别强调了BM25稀疏向量的抗噪机制和多路混合检索的实现逻辑,包括Python代码示例。最后指出生产环境中必须保持模型一致性,并提供了不同业务场景下
本文分享了在有限资源条件下构建AI智能体平台AgentX的技术选型经验。作者基于3台低配云服务器(2C4G)和300元/月的预算约束,详细阐述了6个关键决策: 选择LangChain4j而非Spring AI作为AI编排框架,因其更完善的Agent/Tool支持 采用混合推理架构:本地CPU运行qwen2.5模型处理非实时任务,云端API处理高优先级请求 选用高性能但部署复杂的Milvus作为向量
2026年2月,OpenAI发了一篇博客,悄悄重新定义了软件工程师的日常工作。标题只有两个词: **"Harness Engineering"** 。
本文介绍 Milvus 在 RAG 开发中的实战:从 Docker 部署 etcd、MinIO 与 Milvus 开始,使用阿里云 Embedding 模型向量化文本,通过 PyMilvus 完成存储与检索,并结合大模型生成答案。对比 RecursiveCharacterTextSplitter 与 SemanticChunker 的优缺点,演示 DirectoryLoader、PyMuPDFLo
摘要:Milvus是一款开源向量数据库,专为处理AI时代的非结构化数据(文本、图像等)而设计。它支持三种部署模式(Lite/Standalone/Distributed),采用计算与存储分离的云原生架构。核心功能包括:1)高效向量检索,支持十亿级数据毫秒响应;2)混合搜索能力,结合向量相似性、标量过滤和全文检索;3)丰富的索引类型(HNSW/IVF/DISKANN等)。通过Schema定义数据模型
RAG 系统上线后答案出错,绝大多数团队的第一反应都是换更贵的模型、反复调试 prompt。但有时候,问题其实出在检索层,RAG根本没有召回正确的文档。而这种问题,如果没有量化评估,几乎很难被发现。
他们以为向量数据库就是"把向量存进去、搜出来",选哪个差别不大。但真的上了生产才发现:选错了,要么搜得太慢,要么存得太贵,要么你需要的功能它不支持。
SELECT * FROM articles WHERE title LIKE '%鸿蒙%';-- 只能做关键词匹配,搜不到"HarmonyOS"的文章你搜「怎么优化代码性能」,数据库只能匹配包含这些字的行。它不理解「代码性能」≈「运行速度」≈「执行效率」。场景推荐🚀 快速原型Chroma🏭 生产环境Milvus(自部署) 或(托管)💸 花钱买省心Pinecone(海外) /(国内)我的个人
大模型不是从天上掉下来的,它是一套严密的工程流程的产物,每一个你能感知到的行为,背后都有对应的训练决策。模型"知识丰富"——预训练数据的功劳模型"听得懂人话"——SFT 微调的功劳模型"不乱说话"——RLHF 对齐的功劳模型"能快速响应"——量化和工程优化的功劳模型"答案随机/确定"——你调的 temperature 参数的功劳当模型答错了,你知道这可能是训练数据里没有这个知识,也可能是 SFT
摘要:RAGEval-Chat V2.0项目实现了从CLI到Web应用的架构升级,采用FastAPI+Vue3前后端分离设计,集成Docker一键部署方案。系统核心功能包括基于SSE的流式对话、知识库可视化管理和RAG质量评估体系,支持Recall@K、MRR等指标量化分析。项目创新性地引入AICoding范式,将开发者角色转变为"架构师+指挥官",并计划未来实现自动化参数调优
总体来看,通过这次升级我感觉 FAISS 知识向量数据库更像是一种内存级的知识向量数据库,Milvus 像是更像是一种存在文件系统里面的数据库,可能用传统数据库打比方,FAISS 更像是 Redis ,Milvus像是Mysql。当前的 Paper-RAG-Agent-with-LangGraph 系统使用的 FAISS 知识向量数据库,但是和落地场景下的实际项目还有差距,这次升级主要目的是把这个
**RAG(检索增强生成)** 通过检索外部知识增强大模型回答,解决幻觉与知识滞后。核心流程:文档切片(滑动窗口500/50)→ Embedding(统一模型,本地BGE或云端API)→ 向量检索(Milvus)→ 可选混合检索(加BM25+RRF)→ 可选Rerank(高精度)。索引默认IVF_FLAT,大数据用HNSW;度量选COSINE。选型原则:敏感数据用本地BGE;含专有名词用混合检索;
本文介绍了如何在SpringAI项目中集成Milvus向量数据库实现RAG(检索增强生成)功能。主要内容包括:1)MilvusLite在Windows环境的快速安装指南;2)SpringAI项目配置,包括依赖添加和yml文件设置;3)核心代码实现,涵盖文档加载、文本分块、向量存储及RAG问答流程;4)方案优势分析,强调轻量便捷、持久化存储和兼容性特点。该方案通过统一VectorStore接口实现向
map(r -> new 检索结果(r.getText(), r.getScore()))**技术栈**:Java / Spring Boot / Milvus / RAG / 向量检索。- ✅ **丰富的 SDK**:Java、Python、Go、Node.js 全覆盖。- ✅ **多种索引**:HNSW、IVF_PQ、DiskANN 等按需选择。- **RAG 知识库首选**:Milvus(独
摘要: 某教育集团高中学生管理系统V2.0采用FastAPI+异步SQLAlchemy技术栈,深度融合AI能力,打造智能化管理平台。系统通过AI Agent架构解决传统管理痛点:数据孤岛、评价主观、家校沟通生硬等问题。核心创新包括AI自动评语生成、违纪处理话术教练、学业趋势分析及沉浸式文化学习体验。采用分层解耦设计,支持多模态存储和混合检索,效率较传统方式提升60倍。系统基于国产大模型,通过RBA
本项目为java + milvus + 豆包引擎实现的 RAG AI智能对话功能。后续将会添加文件解析,以及文件内容分片话处理存储向量。
一个很常见的误区是:团队往往会选那个"听起来最高级"的模式,而不是最适合当前问题的那个。更务实的做法是:**从能解决问题的最简单模式出发,观察它在哪里卡住,再往更复杂的方向演进。
那其实到今天,理想 VLA应该要上车了,小鹏也发布下一代图灵芯片的车型要上 VLA,基本上所有用英伟达 Thor 超过500Tops的大算力芯片都会切换到 VLA这个算法概念上。
本文系统对比了五大主流向量数据库(Chroma、Faiss、Milvus、Pinecone、Elasticsearch)的核心原理与适用场景。作者从RAG应用需求出发,首先解析向量数据库的核心概念,包括ANN算法(HNSW、IVF等)和关键性能指标(QPS、召回率等)。随后对每个数据库进行深度剖析:Chroma适合轻量级入门,Faiss专注高性能检索,Milvus提供分布式能力,Pinecone是
首先,明确智能体需要支持的所有意图。然后,针对每个意图,我们需要收集和生成大量的同义句(Query),覆盖各种可能的表达方式。
很多团队把 RAG 当成"万能胶水",结果向量检索召回率极低、大模型答非所问。本文基于阿里云 Milvus 单机版与百炼 Qwen3.6,复盘了企业知识库落地的完整链路,包含数据清洗、向量化策略、混合检索和重排序的实战代码。
从实例到数据,从索引到检索,从验证到复用。alibabacloud-milvus-manage 让团队可以先用小数据集跑通闭环,再逐步扩展到知识库、搜索、推荐和多媒体检索等场景。
最近是不是感觉整个世界都在聊AI?从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。
Apache Kafka 是一个高效的分布式事件流平台,适用于高吞吐量和低延迟的数据处理。它能够实时收集、存储和处理来自多种来源的数据流,如数据库、物联网设备和云服务。Kafka 的强大数据处理能力使其成为 Milvus 或 Zilliz Cloud 等向量数据库的理想数据源。通过 Kafka,可以捕获实时数据流(如用户交互、传感器读数和机器学习模型的嵌入数据),并将这些数据直接发布到 Milvu
大模型(LLM)作为人工智能的核心技术,正在深刻改变我们的生活、学习和工作方式。本文从五个方面探讨了大模型的相关内容:1)LLM基础知识,包括其概念、发展历史及参数规模的影响;2)Prompt Engineering,介绍了提示词的设计原则与类型,如Zero-Shot、Few-Shot、思维链(CoT)等;3)RAG(检索增强生成)的应用;4)Agent的应用;5)多模态模型的发展。文章还提供了大
密集向量是一种在机器学习和数据分析中广泛应用的数值数据表示方法,由包含实数的数组组成,其中大部分或所有元素都不为零。与稀疏向量相比,密集向量在同一维度上包含更多信息,能有效捕捉复杂的模式和关系,使数据在高维空间中更容易分析和处理。密集向量通常有固定的维数,从几十到几百甚至上千不等,具体取决于应用需求。它们主要用于需要理解数据语义的场景,如语义搜索和推荐系统。在语义搜索中,密集向量有助于捕捉查询和文
以前的文章中我介绍了 Attention —— 一种在现代深度学习模型中广泛使用的方法。Attention 的引入显著提升了神经机器翻译系统的性能。在这篇文章中,我们将进一步探讨 Transformer —— 一种以 Attention 为核心、加快训练速度的模型架构。Transformer 在某些任务中甚至超越了 Google Neural Machine Translation 模型。而 Tr
本文介绍了基于Java、Milvus和ResNet50构建以图识图系统的完整方案。系统采用Spring Boot后端架构,结合ResNet50模型提取图像特征,利用Milvus向量数据库实现高效相似度检索。文章详细阐述了技术选型理由,包括使用DJL深度学习框架、HNSW+COSINE相似度算法等关键技术组件,并提供了Docker部署Milvus的配置示例。该系统可有效解决传统文字搜索的局限性,通过
本文记录了彻底弃用 LangChain4j 框架,自研 4 套 Spring Boot Starter(基础工具、文本处理、Ollama、Milvus),重构全链路可控 RAG 底座的实战过程,实现了爬虫分片、向量化、向量入库、AI 仿写的全链路打通,解决了第三方框架黑盒依赖问题,沉淀了可复用的个人 AI 基础设施。
记忆分类明确:短期记忆维护会话上下文,长期记忆实现跨会话持久化技术路线多元:向量检索、知识图谱、OS式管理各有适用场景框架生态成熟:Mem0、Zep、Letta等框架已具备生产可用性性能显著提升:专用记忆层相比全量上下文,延迟降低13倍,Token节省90%安全不容忽视:记忆安全已成为Agent大规模落地的关键瓶颈国内生态崛起:腾讯云、阿里云等厂商推出企业级记忆方案。
很多人一听“向量数据库”,感觉很抽象。其实不用想复杂。用户ID、姓名、手机号、订单号、金额、状态select * from user where name = '张三';这种叫:精确匹配。但是AI场景不一样。我借款还不上怎么办?用户无法按期偿还贷款时,可查看延期还款规则。两个句子字面不一样,但意思接近。传统数据库很难查出来。“我借款还不上怎么办?↓这串数字就叫:向量。如果两句话意思接近,它们的向量
本文系统性地介绍了企业级多Agent系统的架构设计,采用六层模型实现专业化分工协作。架构从API网关层开始,依次通过编排协调层、LangGraph状态机层、Agent核心层、基础设施层和可观测性层,形成完整的处理闭环。重点阐述了多Agent协作的必要性、状态机设计原理、专家团队组织方式,以及成本优化策略。文章指出2026年将是多Agent系统普及的关键节点,并提供了从本地模型优先到混合检索等实用技
本文介绍了基于LlamaIndex框架的多模态视觉语义检索技术,重点探讨了从传统文档检索到跨模态检索的技术演进。文章分析了传统解决方案(文件名搜索、OCR提取、人工标签)的局限性,提出了多模态RAG的核心思想——统一向量空间,通过CLIP双编码器实现文本和图像在同一语义空间中的比较。技术架构分为四个演进阶段:基础(CLIP+Milvus)、进阶(VLM描述增强)、高级(Qwen3-VL黄金架构)和
整个RAG系统做下来,最大的感受是:RAG不是一个单一的技术点,而是一个系统工程。从文档的解析、切分策略的选择、Embedding模型的选型、向量数据库的配置,到检索参数的调优、Prompt的打磨、引用系统的设计,每一个环节都影响着最终效果。切分策略这方面,固定大小加重叠虽然简单,但对语义连续性的保护不够。如果后续要提升召回质量,值得尝试的方向是按语义边界切分,或者有条件的话用父子切割——小块检索
milvus
——milvus
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net