
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文将围绕 Ascend NPU 在 Kubernetes 中是如何被感知、注册和调度的 这一核心问题,结合真实运维场景,给大家依次介绍:ascend-device-plugin-daemonset 是什么它在 Kubernetes 中扮演什么角色它是如何工作的与 NVIDIA GPU device-plugin 的异同实际运维中必须掌握的检查与排障方法
本文介绍了一种新型问答智能体ReflectAgent的设计与实现。该系统通过三阶段"反思回路"(初始回答→自我反思→改进回答)提升复杂问题的处理能力。核心设计包括:1)使用LangGraph构建状态流程图;2)通过ReflectState结构记录完整思考轨迹;3)结合本地工具(文本分析、质量评估)增强LLM能力;4)采用Step机制实现全过程可审计。文章详细拆解了各节点实现,展
A2A协议旨在解决异构智能体之间的互操作与协作问题,支持不同厂商、语言和框架构建的智能体安全通信。其核心目标包括互操作性、动态发现、多模式交互和安全通信。协议围绕A2A Client、Server、Agent Card等关键概念,通过任务(Task)作为基本工作单元,管理有状态交互的生命周期。支持JSON-RPC、gRPC和REST三种传输协议,并依托HTTPS实现安全认证。该协议适用于需要多个智
摘要: 本文演示了如何在LangGraph中使用subgraphs=True参数实现嵌套工作流。通过构建包含子图(research)的父图流程,展示了子图封装与命名空间追踪功能。关键点包括:1) 子图作为独立模块处理特定任务;2) 不同stream_mode下输出带命名空间标识,便于调试;3) 提供了完整代码示例,对比了subgraphs启用前后的流式输出差异。该模式适用于复杂AI工作流(如多智能
摘要:Pydantic v2的RootModel结合联合类型(Union)为现代Web应用和智能系统提供了统一请求入口的优雅解决方案。该方法通过定义单一模型接收多种结构化请求(如ping、initialize等),自动路由到对应子模型,简化了API、WebSocket等接口设计。文章展示了从模型定义、请求分发到FastAPI集成的完整流程,特别适用于LLM智能体、LangGraph节点调度等多类型
传统“模型路由”多数假设一个的候选 LLM 池(static pool),路由器只需要在这组已知模型里挑选最便宜且“够用”的模型;但现实中模型池经常变化:新模型不断上线,旧模型下线。每当模型池变化,重新标注训练数据、重训路由都很费时费钱。这篇论文()关注:测试时出现的新 LLM,如何在路由器的前提下把请求路到合适的新模型上。作者提出了这种新的解决方式:把“每个 LLM”表示成一个,路由器学会基于这
摘要: ReCAP提出了一种递归、可回溯、可修正的长链推理机制,使大语言模型(LLM)能像程序一样递归执行复杂任务,并通过环境反馈动态调整计划。其核心是通过**上下文感知规划(π)拆分嵌套子任务,递归任务栈实现深度优先执行,以及反馈驱动的计划修正(ρ)**实现自我修复。相比传统方法(如CoT、ReAct),ReCAP具备层级性、错误恢复能力和结构化上下文管理,显著提升了长链任务的稳定性与可控性。该
本文介绍了一个基于LangGraph的异步工作流引擎,支持从YAML文件动态加载任务流程并自动执行。系统采用分层设计,将流程描述(YAML)、校验(Pydantic)、执行(LangGraph)和业务逻辑(Tool Registry)解耦,实现声明式编程。关键特性包括:动态节点编排、参数绑定与状态回写、异步并发控制、超时重试机制、故障回退策略以及状态持久化。该设计提供了高扩展性、配置即代码、工业级
本文介绍了一个基于LangChain和LangGraph的长篇文章自动写作系统。该系统能将简单的写作指令智能拆解为结构化写作计划,并逐段生成符合人类写作风格的内容,最终输出为Markdown文档。系统主要包含三大功能模块:写作计划拆解模块(plan_chain.py)负责将用户指令转化为段落级子任务;段落写作模块(write_chain.py)结合上下文逐段生成内容;保存模块将最终文章保存为Mar
本文基于医疗知识图谱开源项目QASystemOnMedicalKG,系统梳理了知识图谱问答系统的实现流程。首先通过构建Neo4j图谱存储医疗实体及关系,包括疾病、症状、食物等节点及其关联。问答时采用AC自动机识别实体,通过疑问词判断问题类型,组合后翻译为Cypher查询,最终将结果转换为自然语言回答。文中以"糖尿病症状"为例,展示了从实体识别、问题分类到图谱查询的完整流程,体现







