logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通义QwQ-32B+Milvus,消费级显卡布满血大模型与RAG的时代来了!

前言最近,通义开源的QwQ-32B模型可谓是火的一塌糊涂。作为一个中型推理模型,QwQ-32B只有320亿参数,但却在多个基准测试中展现出优秀的推理能力,几乎直逼满血版DeepSeek R1,在数学计算、写作与代码编程方面的表现更是相当不错。最重要的是,QwQ-32B不仅性能强大,还极其“亲民”,它体积小、推理快,支持消费级显卡部署,像RTX 4090这样的显卡就能轻松运行,非常适合普通个人开发者

#milvus
爆火 | API终将淘汰,MCP+Milvus+LLM才是Agent开发新范式

去年11月,硅谷AI独角兽Anthropic正式推出了MCP——模型上下文协议,让开发者只需一次编写,就能为大模型对接不同的API、数据库与文件系统,极大降低了模型的配置难度。原因很简单,在做旅行规划的时候,大模型缺乏必要的天气、机票、铁路、导航、酒店等必要数据与工具的接入。Milvus不仅擅长管理海量数据,其高效的相似性搜索和可扩展的向量存储功能,更是让其成为AI Agent的理想之选。有了MC

#milvus#网络#服务器 +2
国产AI如何卖爆海外,答案都在这场实战沙龙(含福利)

国产大模型产业,已经走到命运分野的十字路口。卷基座大模型,万卡集群,万亿参数,也只是入场的门票;卷价格,伴随百模齐发一同到来的,还有价格战的你死我活,披着“AI普惠”的外衣,企业困在居高不下算力成本与客户定价夹缝,生存堪忧。出海,已然成为这届大模型企业及下游应用公司生存的不二之选:Sensor Tower数据显示,美国AI应用市场上半年下载量前十的AI应用中,有三款APP来自中国:Question

#人工智能
Milvus × 联想:向量数据库如何让制造业库存周转率提升10%

要补的话,补多少才合适?早期我们主要靠人工加正则表达式,从这些描述里提取关键词来判断机型,但部分物料的模糊匹配准确率并不理想,而随着物料越来越多、描述越来越乱,这套方法不仅效率低,出错率还不小,维护起来也特别头大。更重要的是,大家不仅能回忆当初,还能基于数据做出更扎实的总结和判断,帮助采购团队精准制定补货策略,避免缺货风险,同时控制好库存规模,提升资金效率。有了这个基础,不管是老物料还是新物料,只

#milvus
沃尔沃RAG实战:企业级知识库,早就该放弃小分块策略

此外,对于Milvus的选型,沃尔沃也没选择比较新的 PyMilvus v2 SDK 及其内置的embedding集成功能,而是选择了 SDK v1 中基于collection的旧版本,从而保证团队能够设计详细的元数据结构,并明确定义每种文档的存储、索引和检索方式。此外,针对格式繁多的非结构化数据,Milvus 支持的字段类型多达 64 种,这让沃尔沃不仅能存储嵌入向量,还能存储丰富的元数据 ——

#人工智能#大数据
Milvus Week | Kafka 很好, Pulsar也不错,但WoodPecker才是未来

Milvus 架构的这一轮革新,不仅简化了整体系统设计,优化了成本结构,也提升了数据Freshness与故障恢复速度。Woodpecker 采用 “ZeroDisk” 架构,所有日志数据存储于云对象存储,元数据则由 etcd 等分布式 KV 系统管理,彻底消除了本地磁盘依赖,降低了运维压力,并提升了数据持久性和扩展能力。通过 Streaming Service,Milvus 实现了原生的数据订阅能

#milvus#kafka#分布式
一手测评|RAG总卡死?大模型给Embedding API 时延背了太多锅了

相比之下,步骤 2 中调用 Embedding API 的延迟,如果高达数百毫秒甚至数秒,就会成为用户能明显感受到的、阻塞整个流程的‘第一道坎’,因此常常是实际的性能瓶颈点。你不再需要在代码中分别对接各个厂商的 SDK,只需在 Milvus 中配置好 Function 并提供你的 API Key(Bring Your Own Key, BYOK),就可以轻松切换和对比不同模型在真实 Milvus

总是深夜报错?这份Helm版Milvus分布式集群离线部署教程请收好

引言"又是一个通宵,就为了部署离线Milvus集群,结果ImagePullBackOff又报错了,镜像拉不下来,证书过期了,存储类找不到,etcd集群起不来……相信这是不少开发者在离线环境部署Milvus时,都遇到过的痛苦经历。平心而论,Kubernetes固然强大,但陡峭的学习曲线和繁琐的配置让人望而生畏。尤其是对于Milvus这样的分布式向量数据库,涉及etcd、MinIO等多个组件的协同部署

#milvus#分布式
先码后学|从Manus到DeepSearcher,2025年最值得关注的十大AI Agent

通过利用 GPT-4 的强大能力,AutoGPT 可以将复杂目标分解为更小的、可执行的任务,按顺序执行这些任务,并根据结果进行迭代,以实现预期的结果。每次对向量数据库中内容完成数据查询后,系统都会启动一个反馈(reflection)流程,然后在每一轮迭代结束时,智能体(Agent)会对查询到的知识进行评估,判断其是否足以解答初始提出的问题。然而,就像人类一样,Agent 需要可靠的记忆才能有效运作

#人工智能
短语检索不等于BM25+向量检索| Milvus Phrase Match实战

它能让你的系统从只能简单理解语义,升级为 “必须包含某短语 + 带语义理解 + 可控 + 可解释”的可落地产品。要匹配同样结构的短语,中文通常需要更大的 slop,数值也更“稀疏”(例如 1、3、5、7…❌ BM25没有词序意识:只能找“connection”, “peer”,词序全乱。——slop 都是在控制“短语中各个词之间允许多远的距离、是否允许插词/倒序”。例如英文用 2,中文可能要 5

#milvus
    共 126 条
  • 1
  • 2
  • 3
  • 13
  • 请选择