
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
人工智能是一门融合了计算机科学、图形学、生物学、语言学等学科的前沿科学。随着电子硬件的发展和算力的提升,人工智能的技术理论逐渐走向落地,各种应用和设想层出不穷,丰富了其内涵和外延。「AI ...
此外,小模型针对特定任务微调的难度与效果也往往更优,更重要的是大模型的泛化能力,应对的是复杂输入,但是agenticAI存在的必要性,即在于把复杂任务拆解成一系列简单可执行的子任务。部署 “数据采集工具”,记录智能体所有 “非人机交互(non-HCI)的模型调用”—— 包括输入给 LLM 的提示词(prompts)、LLM 输出的响应、智能体调用外部工具(如计算器、数据库)的具体内容,还可以有选择
01.写在前面云南数派数据科技有限公司是一家总部位于美丽春城昆明的大模型创新企业,在深圳和昆明双城并立,设立了两个研发中心。我们的旗舰产品——SUPIEDT大模型开发平台,作为一款全生命周期的异构算力大模型开发平台,集一站式企业级大模型开发及服务运行等综合能力于一身。目前,该平台已成功落地全国10家人工智能算力中心,构建起强大的算力网络,能够向客户提供总量超过1000P的算力供应以及数十套大模型的
随着大语言模型问答的流行,直接使用大模型带来的幻觉问题随之暴露出来,同时通用大模型本身不具备详细的领域专有知识会导致对专业问题回答质量不高,使用知识库辅助大模型可以有效解决这些问题。大模型技术的发展正加速对千行百业的改革和重塑,向量数据库作为大模型的海量记忆体、云计算作为大模型的大算力平台,是大模型走向行业的基石。而电商行业因其高度的数字化程度,成为打磨大模型的绝佳“战场”。本次分享将重点介绍向量
一台可通外网的服务器(linux)(另外,阿里云在内的云平台已经出了Moltbot专属云端方案,能简化部署,因此本文重点讲自建部署)接下来,本文教你如何在自己的 Mac 或 Linux 上,部署 Moltbot,对接飞书,搭建属于自己的MilvusAI小助手。也就是说,有了它,我们就约等于给自己配备了一个能思考、能回答问题,还能直接动手操作的24小时赛博助理。最好跑在不要的设备,或者虚拟机环境,毕
用 Exa 搜隔夜全球市场动态,从 Milvus 里捞出我的持仓情况和相关历史经验,喂给大模型生成一份定制化的简报,推送到手机上,告诉我隔夜发生了什么、跟我的持仓有没有关系。此外,我还把自己喜欢的投资大师的风格,写成了skill,模拟类似的情况,他们会怎么决策,作为我自己的决策参考之一。,我之前试过硬刷财经 App,但里面会有大量的不相关信息,淹没了我真正关心的内容;此外,需要注意一点,我们比较关
旧的 embedding 就过期了,需要重新计算。:计算每个chunk的SHA-256哈希,重复内容只索引一次——比如两处都提到“PostgreSQL 16”,只调用一次embedding API,能省20%以上的成本(具体测算:500KB文本,去重后每月可省$0.15,大规模使用可省数百美元)。而我们,也正是被这套记忆系统打动,然后做了一件事:把它的核心设计抽离出来,做成了memsearch,让
本文介绍了Anthropic推出的Skills工具调用标准,相比传统MCP方法具有更精简的上下文、更高标准化和更强可控性。文章详细讲解了Skills的目录结构(SKILL.md核心文件、scripts执行脚本、templates文档模板和resources参考资料),并以创建Milvus Skills为例,演示了如何通过自然语言描述自动构建RAG系统或Milvus Collection。实战部分包

内置Sparse-BM25(将BM25转为稀疏向量预存,检索时无需重新计算),同一个Collection可同时存储稀疏向量(BM25)和稠密向量(语义Embedding),通过Reranker融合结果,兼顾精确匹配和语义匹配。这里有一个关键技术点需要重点说明——BM25(Best Matching 25),它是降低检索类Token消耗的核心:通过词频和逆文档频率计算内容相关性,关键词匹配比纯向量检
需要注意的是,这种裁剪只作用于传递给模型的上下文,磁盘里的完整执行结果不会被修改,后续想找的话,还是能通过记忆检索找到。其中,AGENTS.md存着智能体的指令和记忆使用规则,SOUL.md定义了它的性格和说话语气,USER.md专门记你的相关信息,TOOLS.md则是外部工具的使用指南。,结合语义检索和关键词检索,兼顾了检索的精准度和灵活性(这里原始版本用的是sqlite分别执行关键词与语义检索







