
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepAgent将自己定位为,它本质上仍是工具调用循环,但集成了让智能体深度思考的核心能力。与传统框架不同,DeepAgent通过内置工具和能力,让开发者专注于业务逻辑,而非基础设施搭建。字典配置"description": "用于深度研究复杂问题","system_prompt": "你是一个专业的研究助手,擅长多步骤信息收集和综合","model": "openai:gpt-4o", # 可
与传统RAG相比,PageIndex的结构更加轻量。它不依赖复杂的向量数据库,而是以树状结构将文档组织为可解析的JSON文件,大幅降低了部署难度和成本。同时,它保留了文档的自然上下文,避免了人工分块造成的语义破碎,使得信息在检索时更连贯、更准确。PageIndex的核心优势在于推理型检索。通过让LLM沿树结构逐层推理,它能够找到真正相关的内容,而非仅仅语义相似的段落。每次检索的结果都附带完整的推理
感觉本次Qwen3最大的亮点就是模型原生支持思考模式和非思考模式,可以根据不同的任务需要选择不同的模式,无需跟往常一样同时部署推理模型和对话模型,一个模型即可搞定所有工作。思考模式:在这种模式下,模型会逐步推理,适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用简单问题。
Late Chunking和Contextual Retrieval都为传统分块方法中固有的上下文丢失问题提供了各自的解决方案:● Late Chunking 采用“先嵌入后分块”的方式 ,在多个分块之间保留语义信息,利用的是模型结构的特点,不会造成额外的消耗;● Contextual Retrieval 则基于LLM为每个分块添加文档范围的上下文信息进行增强 ,会造成大量的token损耗,同时效
最近腾讯也开源了一个端到端视觉语言模型POINTS-Reader,在OCR任务上表现不错;至此,国内已经有不少专门针对OCR任务进行训练的开源VLM了。成绩打榜是一方面,实际用起来效果如何、好不好用可能又是另一方面。因此,本文将对比几款最近比较流行的VLM模型,通过不同的Prompt测试模型在PDF上的文本识别效果。
在沉寂了半年之后,智谱推出了新一代开源模型GLM-4.5系列,采用MOE架构并使用混合推理模式。模型统一提升了在等多方面的能力,专为复杂智能体应用打造。由于官方的技术报告暂未发布,模型细节暂时无从得知,本文内容仅做导读,方便读者对该系列模型有个初步认识。
UltraRAG 的核心思想是将一个完整的 RAG流程拆解为一系列独立的、可互相通信的MCP Server,从而根据实际需要进行增删。以下是RAG中的一些核心模块:servers/retriever: 负责从知识库中检索相关文档。servers/reranker: 负责对检索到的文档进行重新排序,提升相关性。servers/generation: 负责基于处理后的信息生成最终答案。servers/
在笔者看来,A2UI的意义不只是多了一种UI方案,而是在于它补齐了Agent从思考到执行的最后一环。对于Agent的开发者来说,可能不再需要去写各种业务相关的界面,而是可以专注于设计Agent能力边界。而Agent的终极形态,不再是聊天机器人,而是会自己搭界面的智能系统。A2UI,可能正是这个方向上非常关键的一步。

在笔者看来,A2UI的意义不只是多了一种UI方案,而是在于它补齐了Agent从思考到执行的最后一环。对于Agent的开发者来说,可能不再需要去写各种业务相关的界面,而是可以专注于设计Agent能力边界。而Agent的终极形态,不再是聊天机器人,而是会自己搭界面的智能系统。A2UI,可能正是这个方向上非常关键的一步。

Mindsearch的Agent设计比较复杂一些,会对问题进行拆解并多次检索,适用于一些深度的总结,有点类似于Perplexity的深度搜索模式。其他几个AI搜索引擎基本流程都是调用搜索引擎对问题进行检索,然后由模型对答案进行总结生成,Agent都比较固定,甚至有一些都没有对问题进行改写。此外,这些框架都能提供数据源支撑,并且生成相似的问题推荐,也是符合目前对主流搜索框架的要求。









