
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了检索增强生成(RAG)技术的核心流程、优缺点及落地场景。RAG通过将文档切块、向量化并存储于向量数据库,在用户提问时检索相关内容辅助大模型生成回答,具有成本低、知识更新灵活、答案可溯源等优势,但也存在系统复杂、检索耗时等问题。RAG适用于企业知识库、智能客服等需要结合私有知识的场景,但实际落地需解决文档处理、检索优化等多方面挑战。
AI Agent与大模型及工作流的核心概念解析 Agent的本质与特性 Agent是具有自主性的AI系统,核心特征包括: 自主规划:能拆解复杂目标为多步任务; 行动能力:通过工具调用与外部交互; 闭环反馈:根据执行结果动态调整策略。与大模型(如GPT)的被动应答不同,Agent能主动执行任务,而非仅生成文本。 核心组件架构 Tools:基础能力单元(如搜索、发邮件),无决策能力。 Agent:以L
文章摘要:Agent是一种能自主规划、行动并闭环执行的AI系统,其核心在于自主性和行动能力,与传统AI的被动响应形成鲜明对比。Agent通过工具调用(Tools)、自主决策(Agent)和流程编排(Workflow)三者协同工作:Tools负责执行具体功能,Agent进行动态决策,Workflow则提供确定性流程框架。实际生产中多采用Agentic Workflow,结合Workflow的可控性和
本文系统梳理了计算机网络核心知识体系,涵盖HTTP协议、HTTPS安全机制、DNS解析、状态管理、负载均衡等关键内容。重点解析了HTTP与HTTPS的区别、TLS四次握手流程、DNS查询机制、Cookie/Session/JWT三种状态管理方案的特点与安全考量。同时深入探讨了HTTP/2性能优化、WebSocket全双工特性、Nginx负载均衡算法等进阶话题,并对比了RPC与HTTP的应用场景差异
HTTP状态码与网络协议摘要 HTTP状态码中,3xx表示重定向:301是永久重定向,302是临时重定向。5xx服务器错误:502表示网关收到无效响应,504是网关超时未收到响应。 HTTPS通过TLS四次握手建立安全连接,使用非对称加密协商对称密钥,数字证书验证身份,防止中间人攻击。HTTP/2相比1.1改进了头部压缩、二进制格式、并发传输和服务端推送。 TCP通过三次握手建立可靠连接,四次挥手
本文详细介绍了SpringBoot集成Kafka的实践过程,主要包括: Kafka生产者的实现方式(同步/异步发送、ACK配置、消息缓冲区) 消费者的核心实现(手动提交offset、长轮询机制、健康检查) SpringBoot集成步骤(依赖引入、配置文件、生产者/消费者代码) Kafka核心机制(Controller、Rebalance、HW/LEO) 常见优化方案(防消息丢失、重复消费、顺序消费
本文系统梳理了主流消息队列(RabbitMQ/Kafka/RocketMQ)的核心技术要点。首先分析了消息队列的三大应用场景:系统解耦、异步处理和流量削峰。针对消息可靠性问题,详细阐述了生产者确认、持久化存储和消费者ACK等保障机制;对于消息积压,提出了扩容消费者、临时Topic分流等解决方案。特别对比了三种消息队列的差异:RabbitMQ基于AMQP协议,提供丰富的交换机类型;Kafka以高吞吐
要想让Docker帮我们安装和部署软件,肯定要保证你的机器上有Docker. 由于大家的操作系统各不相同,安装方式也不同。为了便于大家学习,我们统一在CentOS的虚拟机中安装Docker,统一学习环境。注意:使用MacBook的同学也请利用 VMwareFusion来安装虚拟机,并在虚拟机中学习Docker使用。安装方式参考文档:《安装Docker》首先,我们利用Docker来安装一个MySQL
本文摘要: HTTP状态码301表示永久重定向,302表示临时重定向。502和504错误分别表示网关接收到无效响应和网关请求超时。HTTPS通过TLS握手建立安全连接,防范中间人攻击。HTTP/2相比1.1在头部压缩、二进制格式、并发传输等方面有改进。DNS解析流程包括本地DNS查询、根域名服务器查询等步骤。HTTP无状态但可通过Cookie/Session保持状态,JWT令牌解决了集群部署中的会
JVM内存模型与垃圾回收机制 摘要: JVM内存分为五个区域:程序计数器(线程私有)、虚拟机栈(方法执行)、本地方法栈(Native方法)、堆(对象存储)和方法区(类信息)。堆内存采用分代回收算法,分为新生代(Eden和Survivor区)和老年代。垃圾回收通过可达性分析判断对象存活,主要算法包括标记-清除(产生碎片)、复制(高效但浪费空间)、标记-整理(解决碎片)和分代回收(结合各代特点)。常见







