
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在过去将大模型 Agent 技术落地到医疗等严肃场景时,一直面临着极高的可靠性与合规性要求。为了提升 Agent 的可控性,需要大量算法 + 工程技术的叠加,比如之前分享过的基于BAML的结构化解析方案。近期,关注到Emcie公司开源的高可靠性Agent框架Parlant,该框架以强化指令遵循为核心能力,其核心技术 Attentive Reasoning Queries (ARQ) 看起来对可大模

在之前的文章Agent 落地分享一和Agent 落地分享二中,深入探讨了 Agent 无法落地的诸多问题以及相应的解决方案。其中反复强调的核心问题是如何提升大模型产品的确定性——毕竟,没有人会为一个偶尔超常发挥但时不时"抽风"的产品买单。如何提升大模型产品的确定性,是每一个大模型产品研发团队都需要面对的核心挑战。提升大模型产品的确定性涉及多个维度,本文将从结构化解析这一相对实用且关键的场景入手,分

在之前的文章Agent 落地分享一和Agent 落地分享二中,深入探讨了 Agent 无法落地的诸多问题以及相应的解决方案。其中反复强调的核心问题是如何提升大模型产品的确定性——毕竟,没有人会为一个偶尔超常发挥但时不时"抽风"的产品买单。如何提升大模型产品的确定性,是每一个大模型产品研发团队都需要面对的核心挑战。提升大模型产品的确定性涉及多个维度,本文将从结构化解析这一相对实用且关键的场景入手,分

在之前的文章Agent 落地经验分享(一)中,介绍了 Agent 落地中存在的问题,并给出了一些初步的解决方案。在这篇文章中,针对 Agent 落地中的关键问题,给出更进一步的实战经验,希望对大家的 Agent 产品落地有所帮助。本文主要参考自。本文梳理了来自 humanlayer 的 12 条 Agent 构建经验。对我而言,最重要的启发是保持对 Agent 的“可控性”:避免将任务完全委派给大

在之前的文章Agent 落地经验分享(一)中,介绍了 Agent 落地中存在的问题,并给出了一些初步的解决方案。在这篇文章中,针对 Agent 落地中的关键问题,给出更进一步的实战经验,希望对大家的 Agent 产品落地有所帮助。本文主要参考自。本文梳理了来自 humanlayer 的 12 条 Agent 构建经验。对我而言,最重要的启发是保持对 Agent 的“可控性”:避免将任务完全委派给大

掌握技能最快的方法就是用技能创造产品,前一阵子对 GPT 辅助编程与项目生成做过较多的调研,但是一直处于试水阶段,没能发挥出 GPT 辅助编程的能力。本次从新领域入手,借助 GPT 的力量,从 0 手撸一个量化交易回测平台,从这个过程看看 GPT 辅助编程到底有多强,能多大程度帮助程序员,是否有可能替代程序员。文章本来是希望介绍量化交易回测工具的从 0 手撸的实现过程,但是实际想想,授人予鱼不如授

自 2024 年底以来,行业不断有人喊出"2025 年 Agent 元年"的口号,不少大模型公司也开始调整战略方向,纷纷布局 Agent 领域。然而,大半年过去了,Agent 仅在有限领域实现了落地,在更多严肃的应用场景下,Agent 产品的落地效果并不理想。在新项目中持续进行 Agent 相关产品的开发落地,在探索过程中发现了 Agent 落地的一些关键障碍。结合最近解决问题时整理的资料以及个人

最近因为岗位扩张,经历了密集的简历轰炸。在短短一周内抽空筛查了接近 100+ 的前后端的简历筛选,和 HR 沟通之后,她反馈她那边已经做过一轮简历筛选,过滤掉接近 90% 的简历了,预期 HR 在短期内需要处理 1000+ 的简历筛选。考虑到这个工作的重复性,而且简历内容的筛查还存在一些明显的技术门槛,没有相关的技术背景容易误判,似乎有自动化的必要性。我们当前有一台测试服务器,上面部署了一套Dif

作为医学大模型应用领域的从业者,我持续关注行业最新进展。近期,微软发布的一篇论文在医学大模型领域引起了广泛关注。微软在该论文中构建了一个名为 MAI-DxO 的 Agent 应用,在复杂病例诊断方面取得了显著突破。根据论文数据,MAI-DxO 的诊断准确性达到 85.5%,而人类全科医生的诊断准确性仅为 20% 左右。从表面数据来看,这似乎是一场全方位的碾压。下图中红色点位代表人类医生的平均水平,

随着大模型技术的发展,RAG(检索增强生成)已成为提升AI应用能力的标配方案。在过去两年中,我从最初的 langchain Demo 实践,到QAnything和RagFlow等项目的探索,见证了检索技术从简单的向量检索发展到知识图谱和 Agentic RAG 的过程。然而随着实践深入,RAG 方案的局限性逐渐显现。在处理复杂的现实场景时,简单的检索增强往往力不从心。如何更好地利用外部数据成为了一








