
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
RAG检索优化技术总结 本文针对纯向量检索的三大局限(关键词匹配差、短查询模糊、新词处理弱),提出三种优化方案: 混合搜索:结合向量检索与BM25关键词检索,通过RRF算法融合结果,将召回率从85%提升至92% Reranking:使用BGE等交叉编码器模型对候选结果二次精排,提升排序准确性 多路召回:并行执行不同检索策略后合并去重,增强覆盖率 优化后的检索pipeline显著提升了精确匹配和语义

摘要 本文介绍了AI聊天应用中流式输出(Streaming)的实现原理和具体方法。通过对比非流式和流式两种模式的用户体验差异,指出流式输出能显著提升用户感知速度。文章详细讲解了SSE(Server-Sent Events)协议的特点及其与WebSocket的区别,并提供了三种实现方案: 使用Node.js/Python的OpenAI SDK实现流式调用,只需设置stream: true参数 通过原

这篇文章介绍了一个名为ai-memory的开源工具,它能将AI编程助手(如Cursor/Claude Code)的聊天记录自动转化为结构化知识库。该工具通过命令行操作,可以提取对话中的关键决策、待办事项和问题解决方案,生成Markdown格式的结构化文档,支持团队协作和版本控制。 主要功能包括: 一键提取聊天记录中的519条结构化知识 生成可视化面板展示记忆分布 自动创建AGENTS.md文件供A

ai-memory v2.6.2 是一款开源工具,无需配置API Key即可将AI对话记录(Cursor/Claude Code等)转化为结构化知识库。通过简单命令npx ai-memory-cli extract即可运行,内置免费模型处理最多2个对话。输出为本地Markdown文件,支持git追踪和可视化dashboard查看。与其他工具不同,它直接读取编辑器聊天记录而非需要API调用,保证了数

《ai-memory:让AI记住项目背景的开源工具》介绍了ai-memory工具如何解决开发者在使用Cursor等AI编程助手时反复解释项目背景的痛点。该工具能自动提取历史对话中的结构化记忆(如架构决策、编码规范等),支持增量更新和可视化dashboard,并通过AGENTS.md文件让AI助手在新会话中自动获取项目背景。提供零配置试用,支持多种编辑器,开源地址为https://github.co

AI记忆技术核心突破:ai-memory实现长期项目上下文持续理解 本文深入解析了ai-memory技术如何解决AI编程中的长期记忆痛点。该系统通过三大核心技术方案: 智能分块处理:采用对话边界感知的分块策略,将长对话切分为语义完整的片段,配合噪声过滤预处理,有效降低40%数据量。 五层质量过滤体系: Prompt级结构化约束确保每条记忆满足5项质量标准 技术密度评分量化评估内容价值 双语废话检测

《ai-memory:让AI记住项目背景的开源工具》介绍了ai-memory工具如何解决开发者在使用Cursor等AI编程助手时反复解释项目背景的痛点。该工具能自动提取历史对话中的结构化记忆(如架构决策、编码规范等),支持增量更新和可视化dashboard,并通过AGENTS.md文件让AI助手在新会话中自动获取项目背景。提供零配置试用,支持多种编辑器,开源地址为https://github.co

AI应用安全架构核心摘要 本文系统阐述了AI应用面临的两大核心安全威胁及防御方案: Prompt注入防护 攻击类型:直接注入、间接注入、越狱、编码绕过 防御策略: 输入清洗:正则过滤危险指令 System Prompt加固:设置不可覆盖的安全规则 输出校验:检测敏感信息泄露 双LLM检测:用辅助AI识别注入特征 数据泄露防护 敏感数据类型:PII信息、公司代码、财务数据、API密钥 防护措施: P

摘要:多Agent系统的前端架构演进与挑战 本文探讨了AI应用从单Chat到多Agent系统的架构演进路径。文章将AI应用分为五个层级(L0-L4),重点分析了多Agent系统(L4)对前端架构带来的挑战,包括状态管理和协作展示等。介绍了四种Agent编排模式:串行、并行、路由和监督者,每种模式对应不同的前端展示需求。文章提供了详细的状态模型设计,包括多Agent状态、Agent间通信和执行轨迹记

介绍一套实用的 RCFE 框架(Role + Context + Format + Examples),带你做一个真实的 AI Code Review 工具。让 AI 稳定输出结构化 JSON、用 Few-shot 锁定输出格式,以及五大翻车场景的修复技巧。代码同时提供 JavaScript 和 Python 版本。








