
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文深入探讨了流式输出(SSE)技术原理及其在Python中的实现。文章从OpenAI API的stream参数出发,逐步解析SSE协议的工作机制,包括HTTP长连接、分块传输等底层技术。作者详细对比了SSE与WebSocket、轮询等实时通信方案的差异,并提供了使用FastAPI和Starlette构建SSE服务端的完整实现方案。此外,文章还涵盖了前端EventSource API的使用、逐字渲
本文系统对比了五大主流向量数据库(Chroma、Faiss、Milvus、Pinecone、Elasticsearch)的核心原理与适用场景。作者从RAG应用需求出发,首先解析向量数据库的核心概念,包括ANN算法(HNSW、IVF等)和关键性能指标(QPS、召回率等)。随后对每个数据库进行深度剖析:Chroma适合轻量级入门,Faiss专注高性能检索,Milvus提供分布式能力,Pinecone是
本文总结了OpenAI API进阶应用中的关键优化技术。针对基础功能完备但存在成本、效率和安全问题的AI聊天应用,提出了语义缓存、模型路由、内容安全过滤三大核心解决方案。通过Embedding技术实现语义相似度匹配,可降低30-70%的重复问题API调用成本;采用智能模型路由策略,根据问题复杂度自动选择不同价位模型;构建三层内容过滤架构保障合规安全。此外还介绍了MCP协议标准化工具集成、日志监控提
本文总结了OpenAI API进阶应用中的关键优化技术。针对基础功能完备但存在成本、效率和安全问题的AI聊天应用,提出了语义缓存、模型路由、内容安全过滤三大核心解决方案。通过Embedding技术实现语义相似度匹配,可降低30-70%的重复问题API调用成本;采用智能模型路由策略,根据问题复杂度自动选择不同价位模型;构建三层内容过滤架构保障合规安全。此外还介绍了MCP协议标准化工具集成、日志监控提
本文是作者学习OpenAI API的实践总结,从Prompt设计到API实现的完整指南。文章详细介绍了Chat Completions API、流式输出(SSE)、Function Calling等核心功能,并提供了可运行的代码示例。内容涵盖环境配置、消息角色体系、Token计算、错误处理、多轮对话管理等关键技术点,最后通过一个AI对话应用项目验证所学。作者分享了从理论到实践的完整学习路径,特别推
本文是作者学习OpenAI API的实践总结,从Prompt设计到API实现的完整指南。文章详细介绍了Chat Completions API、流式输出(SSE)、Function Calling等核心功能,并提供了可运行的代码示例。内容涵盖环境配置、消息角色体系、Token计算、错误处理、多轮对话管理等关键技术点,最后通过一个AI对话应用项目验证所学。作者分享了从理论到实践的完整学习路径,特别推
《Prompt工程完全指南》系统介绍了Prompt设计的核心要素与技术体系。文章首先阐述了Prompt工程在AI应用中的关键地位,指出Prompt质量决定了AI效果上限。随后详细解析了Prompt基础结构的五大要素:角色设定、任务指令、上下文注入、输出格式控制和约束条件,并对比了优劣Prompt的实际效果差异。 在进阶技术部分,文章涵盖了少样本提示、思维链推理、自洽性验证等5种推理方法,以及JSO
def llm_chunking_with_summary(text : str , llm : ChatOpenAI) - > list : """LLM 分块并生成每个 chunk 的摘要""" prompt = f"""请将以下文档按主题分为若干段落,并为每个段落生成一句话摘要。输出格式(JSON):{{"summary": "段落摘要", "content": "段落原文"}},...文档







