logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型RAG系统优化:企业级落地关键技术

原创技术解读 | 深入剖析RAG系统的性能优化策略 摘要RAG(检索增强生成)系统已成为企业大模型应用的主流架构。本文从工程实践角度,系统讲解RAG系统的性能优化策略,包括检索优化、生成优化、系统架构优化等关键技术点,帮助企业构建高性能、低成本的RAG系统。## 一、RAG系统性能瓶颈分析### 1.1 典型性能问题在企业级RAG系统中,常见的性能瓶颈包括:| 瓶颈类型 | 具体表现 | 影响

#人工智能#jira
LangChain RAG 技术深度实战:从原理到生产级优化全链路

LangChain 在 RAG 领域的地位,就像 React 在前端开发中的地位——争议很多,但绕不开。本文不讨论"要不要用 LangChain",而是聚焦在用 LangChain 实现生产级 RAG 的关键技术点,包括很多官方文档里没说清楚的坑。答案相关性(Answer Relevance) ▲ / \ / \ / \上下文相关性 ──── 答案忠实度(Context (Faithfulness

#开源#人工智能#架构 +2
HermesAgent 完全指南:2026年最火开源 AI 智能体架构解析与部署实战

支持的平台包括:- 即时通讯:Telegram、WhatsApp、Discord、Slack、微信(企业微信)- 语音:Twilio、Discord 语音频道- Web:REST API、WebSocket。—## 六、使用场景最佳实践### 场景一:个人 AI 助手在 Telegram 上部署一个记得你所有偏好、能跨设备同步的个人助手。:- 7天后:用户满意度指标提升 12%- 30天后:首次回

#开源#人工智能#架构
Function Calling深度指南:让LLM精准调用工具的工程实践

如果把AI Agent比作一个人,Function Calling就是它的双手——让语言模型从"说说而已"变成"真正执行"。这是从"AI助手"到"AI Agent"的本质跨越。:防止Agent进入无限循环,生产环境必不可少掌握Function Calling,是从"会用LLM"到"能构建AI Agent"的关键一步。—## 总结Function Calling是构建AI Agent的核心机制,工程

#python#github#人工智能 +1
AI Agent 记忆系统设计 2026:从无状态到有记忆的工程实践

没有记忆的 Agent 就像一个每天醒来都失忆的人——能做事,但永远无法积累经验。 一、为什么 Agent 需要记忆当前大多数 AI Agent 的根本局限在于:它们是无状态的。每次对话结束,Agent 就"遗忘"了一切。下次对话,一切从头开始。这带来的问题是显而易见的:- 重复犯错:同样的错误反复出现,因为 Agent 不记得上次已经犯过- 无法积累经验:Agent 无法从

#人工智能
AI Agent 可观测性与监控体系 2026:让黑盒变白盒

适合什么指标能反映系统的健康状态?人工评估更快的排障速度、更低的运行成本、更高的系统可靠性、更清晰的优化方向。

#人工智能#系统架构
AI Agent测试策略:让自主智能体在生产环境中不翻车

Agent可能在测试时表现良好,在生产中遇到边界输入时出现意外行为本文将系统讲解AI Agent的测试策略,从单元测试到端到端测试,从功能测试到安全测试。:持续采样评估,及时发现质量退化Agent测试没有银弹,但有了系统化的测试策略,可以把"不知道Agent什么时候会翻车"变成"在可接受的风险范围内稳定运行"。—## 五、端到端场景测试端到端测试是最有价值但也最昂贵的测试类型。—## 三、LLM组

#人工智能#log4j#python3.11
AI工作流自动化2026:用LangGraph构建生产级多步骤Agent系统

2024年,LLM Agent是开发者最热的实验方向;2026年,它已经变成了企业的核心生产力工具。但从实验到生产,中间有一道深壑——如何构建一个能稳定运行、可观测、可回滚的多步骤Agent系统?LangGraph给出了目前最接近工程化答案的方案。本文将深入拆解LangGraph的核心设计哲学,并给出一套可落地的生产级Agent工作流构建指南。—## 一、为什么需要LangGraph?LangCh

#人工智能#自动化#windows +1
AI产品冷启动方法论:从0到1构建有用户愿意留下来的AI应用

1. 找到了真正热爱写作的目标用户(而非随机用户)2. 快速砍掉了不工作的功能3. 让用户成为产品的传播者—## 总结AI产品冷启动的本质,和任何好产品的冷启动一样:**找到最合适的用户,在最短时间内给他们最真实的价值体验。:- GitHub Copilot:用户第一次接受AI的代码建议,省下了10分钟的工作- Notion AI:用户用一句话生成了一份会议纪要,发现质量比自己写的还好- Curs

#人工智能#系统架构
    共 620 条
  • 1
  • 2
  • 3
  • 62
  • 请选择