
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文分享了一个智能问答系统的开发优化过程。针对三个不同子场景的智能问答需求,作者最初采用纯RAG技术建立三个知识库,但效果不佳,出现场景判断不清和召回率低的问题。后通过重新思考,改为按数据类型建立两个知识库(结构化与非结构化),并实现条件查询和相似度查询两个工具,让模型根据需求自主选择。此方案简化了技术实现,大幅提升了系统效果,解决了场景区分和混合数据查询问题。大模型应用开发流程正确,但结果不一定

除了模型这个大脑之外,上下文工程应该是最重要的存在之一。它既关系到利用的广度,又关系到模型利用的质量。概念关系概览(来源:参考资料[5])

一句话足矣~本文主要讲解了微舆的整体架构,并通过研读并调试源码,整理了多个Agent各自的执行流程、以及前后端交互。如项目原理、项目部署、源码等存在疑问,欢迎随时私信或留言交流!

本文立足于文史知识库构建的实际需求,以典故知识分析为案例,设计了三项面向大语言模型的评测任务(典故知识结构化整理、用典判断和典故识别),并系统评测了多种模型在该系列任务上的表现。实验结果表明,大语言模型能够较为高效地完成文本结构化处理类的工作,并表现出一定的文史知识判断能力,而检索增强生成、微调模型等策略均能有效提升大模型的文史知识。进一步地,本文在大语言模型能力、调用方式、引导策略等方面获得了有
OPENAI在AGI五级分类中对agent的定义*

它不再是一个“被动问答”的机器人,而是一个具备目标感的智能体,会判断当前任务、设定下一步行动,并协调外部能力来完成任务。它让模型能够请求执行“具体动作”——比如读取数据库、访问第三方接口、调动系统命令等。实际应用中,这套架构可以做什么?自动办公助手:你一句话,它帮你整合日程、会议、提醒、邮件。企业客服系统:AI 主动识别问题类型并调用查询接口,精准回复客户。智能报表生成器:你说“帮我生成上月销售排

这个春节期间,DeepSeek 无疑是风头最劲的 AI 应用。近日,DeepSeek 背后的公司深度求索又爆出以百万年薪招募顶尖 AI 人才。消息一出,迅速引发全网热议。微博上,#DeepSeek 发布招聘年薪百万# 话题迅速冲上热搜,评论区被 “别人家公司”、“现在转行 AI 还来得及吗” 等羡慕声刷屏。DeepSeek 的招募主要面向大模型算法、AGI(通用人工智能)研究、高性能计算等领域的顶

知识图谱(KG)的发展与人工智能(AI)代理的进步紧密相连。从它们的静态起源开始,知识图谱已经发展到包括动态、时态和事件驱动的范式,每个范式都为AI系统解锁了新的能力。本文探讨了它们的演变以及大型语言模型(LLM)如何融入这些进步。简而言之,所有知识图谱的演变都是关于时间的。静态图谱静态知识图谱是基础结构,其中实体和关系是固定不变的。例如,WordNet、Freebase和Kinship将实体表示

今天来和大家分享unsloth公开的笔记本,这篇jupyter notebook提供了一个增强过的整个GRPO流程。链接:llama3.1 8B版本:Qwen2.5 1.5B版本:我们知道r1在思考的时候总能”啊哈“灵光一现找到关键思路,而r1训练过程的第一阶段得到的r1-zero就是使用了组相对策略优化(GRPO)自主学会了在没有人类反馈的情况下分配更多思考时间。

本文探讨企业级AI落地的"智能体鸿沟"问题,以及Salesforce通过AgentForce平台的解决方案。文章分析了消费级与企业级AI的差异,介绍了AgentForce如何通过"上下文工程"实现数据集成、业务理解和人机协同,展示了从客服到供应链的多个行业应用案例,并提出了企业AI应从"模型竞赛"转向"上下文竞赛"、从单点工具转向Agent网络、从技术采购转向能力建设的三大发展方向。过去 26 年








