logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Dify 1.8.0采用蜂巢架构实现模块化设计,核心包含API服务、Web前端等模块,并行ID分组解决工作流节点

Dify 1.8.0采用蜂巢架构实现模块化设计,核心包含API服务、Web前端等模块。关键技术包括:1)RAG实现机制,通过递归分块和混合检索优化文档处理;2)Agent决策机制,支持Function Calling和ReAct两种策略。文章还提供了两个实用案例:1)通过并行ID分组解决工作流节点重复执行问题;2)调整分块参数优化RAG检索性能。该架构具有灵活性、可维护性和扩展性优势,支持从原型到

文章图片
#人工智能#自然语言处理#机器学习 +2
【python文件处理】使用 open() 函数打开文件、 File 操作文件、使用 OS 对象操作文件目录的知识,使用 open() 函数打开文件

使用 open() 函数打开文件、 File 操作文件、使用 OS 对象操作文件目录的知识,使用 open() 函数打开文件

文章图片
#numpy#人工智能#nlp +3
【万文超详总结】深入总结检索技术演进,对比稠密嵌入(BERT、BGE-M3)和稀疏嵌入(TF-IDF、BM25)的优劣,并验证混合检索策略的优越性。进一步总结RAPTOR和GraphRAG处理复杂知识

摘要:本文系统梳理了RAG(检索增强生成)技术的核心概念及应用实践。首先介绍RAG的基本原理和系统架构,分析其通过实时检索外部知识库增强生成模型能力的特点。随后深入探讨检索技术演进,对比稠密嵌入(BERT、BGE-M3)和稀疏嵌入(TF-IDF、BM25)的优劣,并验证混合检索策略的优越性。进一步探讨结构化索引方法(RAPTOR和GraphRAG)在处理复杂知识时的表现。最后提出Agentic R

文章图片
#人工智能#自然语言处理#机器学习 +4
Langfuse 链路追踪在基于 Agent 的 RAG 系统中的实现原理与代码实践

摘要: Langfuse是一款专为LLM应用设计的可观测性工具,通过链路追踪(Tracing)技术监控Agent-RAG系统的全流程(Agent调度、RAG检索、LLM调用等)。其核心原理是以TraceID串联操作,形成树状调用链(Trace为根节点,Span记录子操作耗时和状态)。在RAG系统中,Langfuse可追踪用户提问→Agent解析→文档检索→LLM生成→结果返回的全链路,并通过Pyt

文章图片
#人工智能#前端#python +4
【超详细prompt解读】提示词优化指令设计指导语言模型完成任务与应用场景如文本摘要、信息提取、多轮问答、编写原则:使用分隔符、结构化输出、少样本提示等、APE和APE和BROKE两大提示工程框架

本文系统介绍了提示词工程(Prompt Engineering)的概念、应用场景及编写原则。主要内容包括:1)提示词工程的定义和作用,即通过优化指令设计指导语言模型完成任务;2)常见应用场景如文本摘要、信息提取、多轮问答等NLP任务;3)编写原则包括使用分隔符、结构化输出、少样本提示等技巧;4)介绍了APE和BROKE两大提示工程框架;5)讲解了问答系统中Prompt模板的使用方法。文章通过具体代

文章图片
#自然语言处理#nlp#人工智能 +3
【从模仿到创造:大模型如何通过“先SFT后RL”实现能力进化?】

本文探讨了大语言模型后训练中监督微调(SFT)与强化学习(RL)的辩证关系。SFT通过高质量数据快速固化模型的输出格式和行为规范,追求高效稳定;而RL则通过试错探索任务本质,提升泛化能力。研究表明,SFT擅长"形"的塑造,RL侧重"神"的注入,二者协同作用:先用SFT建立稳定的输出框架,再用RL优化策略性能。多个实验验证了这一"先SFT后RL&qu

文章图片
#人工智能#深度学习#nlp +4
【超详细搭建基于ReAct模式的AgenticRAG系统架构】系统支持多种知识库类型,包括本地检索、Dify API、RAPTOR和GraphRAG等,实现快速检索相关片段和获取完整文档

本文介绍了一个基于ReAct模式的AgenticRAG系统架构,通过"思考-行动-观察"循环处理用户查询。系统包含Agent核心逻辑、工具集、配置模块、评估模块和主程序入口等组件。文章以法律领域为例,详细说明了数据集的构建方法,分为简单案例(测试基础检索能力)和复杂案例(评估多步推理能力)。系统支持多种知识库类型,包括本地检索、Dify API、RAPTOR和GraphRAG等

文章图片
#人工智能#自然语言处理#深度学习 +4
【超详MCP框架搭建】支持三种Client-Server通信方式:stdio适用于标准输入输出实现进程间通信;HTTP+SSE支持远程多客户端连接,基于Server-SentEvents实现实时推送

MCP框架支持三种Client-Server通信方式:stdio适用于本地测试,通过标准输入输出实现进程间通信;HTTP+SSE支持远程多客户端连接,基于Server-SentEvents实现实时推送;StreamableHTTP是最新推荐方式,采用流式HTTP协议,具有统一端点、按需流式传输和状态管理等优势。三种方式均通过MCPClientSession提供统一的工具调用、资源操作和提示词模板功

文章图片
#人工智能#自然语言处理#python +3
【万文超详总结】深入总结检索技术演进,对比稠密嵌入(BERT、BGE-M3)和稀疏嵌入(TF-IDF、BM25)的优劣,并验证混合检索策略的优越性。进一步总结RAPTOR和GraphRAG处理复杂知识

摘要:本文系统梳理了RAG(检索增强生成)技术的核心概念及应用实践。首先介绍RAG的基本原理和系统架构,分析其通过实时检索外部知识库增强生成模型能力的特点。随后深入探讨检索技术演进,对比稠密嵌入(BERT、BGE-M3)和稀疏嵌入(TF-IDF、BM25)的优劣,并验证混合检索策略的优越性。进一步探讨结构化索引方法(RAPTOR和GraphRAG)在处理复杂知识时的表现。最后提出Agentic R

文章图片
#人工智能#自然语言处理#机器学习 +4
【超详细pandas学习】安装与导入;核心数据结构Series和DataFrame的创建与操作;文件读写操作(CSV、Excel、TXT);数据查看与选择;数据增删改操作;数据清洗(去重、缺失值处理)

本文介绍了Python中pandas库的基本使用方法,主要包括:1)安装与导入;2)核心数据结构Series和DataFrame的创建与操作;3)文件读写操作(CSV、Excel、TXT);4)数据查看与选择;5)数据增删改操作;6)数据清洗(去重、缺失值处理);7)常用统计计算(均值、中位数等);8)数据类型转换;9)数据索引与标签操作;10)数据的数学运算。文章通过具体代码示例,系统讲解了pa

文章图片
#python#pycharm#人工智能 +3
    共 11 条
  • 1
  • 2
  • 请选择