logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从Nginx到AI网关:网关技术的演进之路

摘要:AI网关——大模型时代的智能交通枢纽 本文探讨了从传统Nginx网关到AI网关的技术演进。随着大模型应用场景的复杂化,传统网关在处理多模型协同、Token管理、语义缓存等方面显现不足。AI网关作为新一代解决方案,具备十大核心能力:多模型代理、容灾回退、智能负载均衡、内容安全管控等,实现了从"交通规则管理"到"交通成本优化"的升级。文章采用费曼学习法,通过医疗分诊、银行窗口等生活化类比,帮助读

文章图片
#nginx#人工智能#运维
Harness Engineering驾驭工程:给AI套上缰绳的艺术

驾驭工程:给AI套上缰绳的艺术 本文探讨了AI工程化中的关键挑战——如何有效控制AI系统的行为。作者提出"驾驭工程"(Harness Engineering)概念,类比自动驾驶汽车的安全架构,强调需要为AI系统建立输入管控、输出约束、工具管理和故障恢复机制。文章通过真实案例展示了未经管控的AI可能导致的JSON乱码、死循环和安全漏洞等问题,并详细拆解了驾驭工程的四个维度:输入模板校验、输出格式约束

文章图片
#人工智能
AI助手模块工作流程技术总结

二、离线数据处理流水线(知识库构建)2.1 整体流程2.2 各技术切片详解2.2.1 文档解析 —函数职责技术细节读取 TXT 文件自动尝试 utf-8/gbk/gb2312/utf-16 编码清洗文本正则替换 HTML 标签为换行,压缩多余空行,去除中文间空格按章节拆分正则匹配章节标题,返回列表2.2.2 文本分块 —组件技术细节主方案LangChain分隔符优先级: →→→→→→

#人工智能
某教育集团一贯制(高中)学生管理系统项目实践

摘要: 某教育集团高中学生管理系统V2.0采用FastAPI+异步SQLAlchemy技术栈,深度融合AI能力,打造智能化管理平台。系统通过AI Agent架构解决传统管理痛点:数据孤岛、评价主观、家校沟通生硬等问题。核心创新包括AI自动评语生成、违纪处理话术教练、学业趋势分析及沉浸式文化学习体验。采用分层解耦设计,支持多模态存储和混合检索,效率较传统方式提升60倍。系统基于国产大模型,通过RBA

文章图片
#人工智能#milvus
Mem0:让AI智能体拥有真正记忆

Mem0框架是一个革命性的AI记忆系统,通过创新的双阶段处理流水线和智能记忆层架构,解决了当前AI系统的"记忆危机"。该系统采用持久化记忆存储、智能检索和动态更新机制,显著提升了AI助手的记忆准确性和交互连续性。相比传统方案,Mem0在准确率提升26%的同时降低了91%的延迟,并节省90%以上的token使用量。该框架为构建真正具备长期记忆能力的AI智能体提供了完整解决方案,成

文章图片
#人工智能#AI
行业Agent记忆:从功能分类到实现路径

记忆分类明确:短期记忆维护会话上下文,长期记忆实现跨会话持久化技术路线多元:向量检索、知识图谱、OS式管理各有适用场景框架生态成熟:Mem0、Zep、Letta等框架已具备生产可用性性能显著提升:专用记忆层相比全量上下文,延迟降低13倍,Token节省90%安全不容忽视:记忆安全已成为Agent大规模落地的关键瓶颈国内生态崛起:腾讯云、阿里云等厂商推出企业级记忆方案。

文章图片
#分类#人工智能#数据挖掘 +1
Agent记忆管理:从短期记忆到长期记忆的认识

Agent记忆管理技术摘要 Agent记忆管理是AI智能体实现持续学习和个性化交互的核心能力,包含短期记忆和长期记忆两个层级。短期记忆绑定会话生命周期,用于维护对话上下文;长期记忆跨会话持久化,存储用户偏好和关键信息。技术实现上采用分层架构: 短期记忆通过内存缓存和Checkpointer机制实现 长期记忆依赖向量数据库进行语义化存储和检索 跨会话记忆通过BaseStore实现用户级状态管理 关键

文章图片
#人工智能
Agent记忆管理-人类记忆的后半段

Agent记忆管理技术正在从简单的状态维护发展为复杂的智能记忆系统。通过合理的架构设计、安全治理和性能优化,我们可以构建出强大、可靠、高效的AI记忆管理系统。关键要点回顾记忆分类明确:短期记忆维护会话上下文,长期记忆实现跨会话持久化技术架构完善:Checkpointer机制 + 向量数据库 + BaseStore的完整解决方案安全治理重要:权限控制、隐私保护、生命周期管理的企业级考量性能优化关键:

#microsoft#人工智能
多模态文搜图图搜图:视觉语义检索的边界

本文介绍了基于LlamaIndex框架的多模态视觉语义检索技术,重点探讨了从传统文档检索到跨模态检索的技术演进。文章分析了传统解决方案(文件名搜索、OCR提取、人工标签)的局限性,提出了多模态RAG的核心思想——统一向量空间,通过CLIP双编码器实现文本和图像在同一语义空间中的比较。技术架构分为四个演进阶段:基础(CLIP+Milvus)、进阶(VLM描述增强)、高级(Qwen3-VL黄金架构)和

文章图片
#人工智能#milvus
PDF图文混排企业实践:RAG的“最后一公里“

本文深入探讨了如何利用LlamaIndex框架解决图文混排PDF文档检索的难题。文章首先分析了企业数据现状,指出80%高价值信息被锁定在PDF中,并揭示了PDF格式的本质矛盾。随后详细阐述了四大技术挑战:布局语义丢失、多模态信息割裂、表格结构熵增和上下文碎片化。 技术方案部分提供了6步实战技术地图,对比了pypdf、PyMuPDF、LlamaParse和MinerU四种解析工具的优缺点。核心实现包

文章图片
#信息可视化
    共 26 条
  • 1
  • 2
  • 3
  • 请选择