名为沙丁鱼的猫446 个人主页

@2402_87515571

名为沙丁鱼的猫446

2024-10-08 13:28:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Dify 1.8.0采用蜂巢架构实现模块化设计，核心包含API服务、Web前端等模块，并行ID分组解决工作流节点

Dify 1.8.0采用蜂巢架构实现模块化设计，核心包含API服务、Web前端等模块。关键技术包括：1）RAG实现机制，通过递归分块和混合检索优化文档处理；2）Agent决策机制，支持Function Calling和ReAct两种策略。文章还提供了两个实用案例：1）通过并行ID分组解决工作流节点重复执行问题；2）调整分块参数优化RAG检索性能。该架构具有灵活性、可维护性和扩展性优势，支持从原型到

#人工智能 #自然语言处理 #机器学习 +2

【python文件处理】使用 open() 函数打开文件、 File 操作文件、使用 OS 对象操作文件目录的知识，使用 open() 函数打开文件

使用 open() 函数打开文件、 File 操作文件、使用 OS 对象操作文件目录的知识，使用 open() 函数打开文件

#numpy #人工智能 #nlp +3

【万文超详总结】深入总结检索技术演进，对比稠密嵌入（BERT、BGE-M3）和稀疏嵌入（TF-IDF、BM25）的优劣，并验证混合检索策略的优越性。进一步总结RAPTOR和GraphRAG处理复杂知识

摘要：本文系统梳理了RAG（检索增强生成）技术的核心概念及应用实践。首先介绍RAG的基本原理和系统架构，分析其通过实时检索外部知识库增强生成模型能力的特点。随后深入探讨检索技术演进，对比稠密嵌入（BERT、BGE-M3）和稀疏嵌入（TF-IDF、BM25）的优劣，并验证混合检索策略的优越性。进一步探讨结构化索引方法（RAPTOR和GraphRAG）在处理复杂知识时的表现。最后提出Agentic R

#人工智能 #自然语言处理 #机器学习 +4

Langfuse 链路追踪在基于 Agent 的 RAG 系统中的实现原理与代码实践

摘要： Langfuse是一款专为LLM应用设计的可观测性工具，通过链路追踪（Tracing）技术监控Agent-RAG系统的全流程（Agent调度、RAG检索、LLM调用等）。其核心原理是以TraceID串联操作，形成树状调用链（Trace为根节点，Span记录子操作耗时和状态）。在RAG系统中，Langfuse可追踪用户提问→Agent解析→文档检索→LLM生成→结果返回的全链路，并通过Pyt

#人工智能 #前端 #python +4

【超详细prompt解读】提示词优化指令设计指导语言模型完成任务与应用场景如文本摘要、信息提取、多轮问答、编写原则：使用分隔符、结构化输出、少样本提示等、APE和APE和BROKE两大提示工程框架

本文系统介绍了提示词工程（Prompt Engineering）的概念、应用场景及编写原则。主要内容包括：1）提示词工程的定义和作用，即通过优化指令设计指导语言模型完成任务；2）常见应用场景如文本摘要、信息提取、多轮问答等NLP任务；3）编写原则包括使用分隔符、结构化输出、少样本提示等技巧；4）介绍了APE和BROKE两大提示工程框架；5）讲解了问答系统中Prompt模板的使用方法。文章通过具体代

#自然语言处理 #nlp #人工智能 +3

【从模仿到创造：大模型如何通过“先SFT后RL”实现能力进化？】

本文探讨了大语言模型后训练中监督微调(SFT)与强化学习(RL)的辩证关系。SFT通过高质量数据快速固化模型的输出格式和行为规范，追求高效稳定；而RL则通过试错探索任务本质，提升泛化能力。研究表明，SFT擅长"形"的塑造，RL侧重"神"的注入，二者协同作用：先用SFT建立稳定的输出框架，再用RL优化策略性能。多个实验验证了这一"先SFT后RL&qu

#人工智能 #深度学习 #nlp +4

【超详细搭建基于ReAct模式的AgenticRAG系统架构】系统支持多种知识库类型，包括本地检索、Dify API、RAPTOR和GraphRAG等，实现快速检索相关片段和获取完整文档

本文介绍了一个基于ReAct模式的AgenticRAG系统架构，通过"思考-行动-观察"循环处理用户查询。系统包含Agent核心逻辑、工具集、配置模块、评估模块和主程序入口等组件。文章以法律领域为例，详细说明了数据集的构建方法，分为简单案例（测试基础检索能力）和复杂案例（评估多步推理能力）。系统支持多种知识库类型，包括本地检索、Dify API、RAPTOR和GraphRAG等

#人工智能 #自然语言处理 #深度学习 +4

【超详MCP框架搭建】支持三种Client-Server通信方式：stdio适用于标准输入输出实现进程间通信；HTTP+SSE支持远程多客户端连接，基于Server-SentEvents实现实时推送

MCP框架支持三种Client-Server通信方式：stdio适用于本地测试，通过标准输入输出实现进程间通信；HTTP+SSE支持远程多客户端连接，基于Server-SentEvents实现实时推送；StreamableHTTP是最新推荐方式，采用流式HTTP协议，具有统一端点、按需流式传输和状态管理等优势。三种方式均通过MCPClientSession提供统一的工具调用、资源操作和提示词模板功

#人工智能 #自然语言处理 #python +3

#人工智能 #自然语言处理 #机器学习 +4

【超详细pandas学习】安装与导入；核心数据结构Series和DataFrame的创建与操作；文件读写操作（CSV、Excel、TXT）；数据查看与选择；数据增删改操作；数据清洗（去重、缺失值处理）

本文介绍了Python中pandas库的基本使用方法，主要包括：1）安装与导入；2）核心数据结构Series和DataFrame的创建与操作；3）文件读写操作（CSV、Excel、TXT）；4）数据查看与选择；5）数据增删改操作；6）数据清洗（去重、缺失值处理）；7）常用统计计算（均值、中位数等）；8）数据类型转换；9）数据索引与标签操作；10）数据的数学运算。文章通过具体代码示例，系统讲解了pa

#python #pycharm #人工智能 +3

共 11 条

请选择